電影制作是一個(gè)非常復(fù)雜的過程,從開始確定成本到制定有針對(duì)性的營(yíng)銷活動(dòng),涵蓋多個(gè)流程。數(shù)據(jù)科學(xué)幾乎涉及到該過程中的每一步,而且從事數(shù)據(jù)科學(xué)工作的專業(yè)人員,也可以從電影行業(yè)中學(xué)到很多東西。
流媒體服務(wù)可以說處于數(shù)據(jù)科學(xué)領(lǐng)域的最前沿。很多視頻制作公司會(huì)分析大數(shù)據(jù)中的模式,為他們的內(nèi)容創(chuàng)作提供參考,并為用戶提出個(gè)性化的觀看建議。通過這種方式,數(shù)據(jù)科學(xué)可以幫助影視娛樂創(chuàng)作和營(yíng)銷達(dá)到前所未有的水平。
數(shù)據(jù)科學(xué)本身也在各種電影中成為創(chuàng)作主題。近年來,以阿蘭·圖靈和約翰·納什等現(xiàn)實(shí)生活中的著名人物為原型的故事已經(jīng)被搬上了大熒幕,同時(shí)也有很多以預(yù)測(cè)分析,機(jī)器學(xué)習(xí)和人工智能為主題的虛構(gòu)電影。
整個(gè)社會(huì)對(duì)數(shù)據(jù)科學(xué)的關(guān)注表明,未來會(huì)出現(xiàn)更多有關(guān)這一主題的電影。此外,影師制作公司也將通過數(shù)據(jù)科學(xué)技術(shù)來更好地理解個(gè)人觀看習(xí)慣和偏好,以創(chuàng)作更加吸引觀眾的內(nèi)容。
電影的成功指標(biāo)和相關(guān)數(shù)據(jù)
技術(shù)可以告訴電影制作人他們應(yīng)該如何去制作電影,以及如何去進(jìn)行營(yíng)銷。從電影選角,到甚至是營(yíng)銷中使用的配色,電影的每個(gè)方面都會(huì)影響票房。使用數(shù)據(jù)科學(xué)技術(shù),我們可以預(yù)測(cè)觀眾的偏好,并確定如何優(yōu)化內(nèi)容以實(shí)現(xiàn)其最大潛力。
預(yù)測(cè)觀眾對(duì)電影的期望,幾乎可以說是票房的保證了。2018年,被迪斯尼公司收購(gòu)的??怂拱l(fā)布了一篇論文,概述了如何使用機(jī)器學(xué)習(xí)分析電影預(yù)告片的內(nèi)容。在這一過程中,收集的數(shù)據(jù)用于對(duì)比預(yù)告片,并預(yù)測(cè)看過該預(yù)告片會(huì)對(duì)其他哪些類型的電影感興趣。
??怂故褂霉雀璺?wù)器和開源AI框架TensorFlow創(chuàng)建了Merlin,一個(gè)“實(shí)驗(yàn)性的電影上座率預(yù)測(cè)和建議系統(tǒng)。”在Merlin的試運(yùn)行期間,電影公司使用該工具分析了《金剛狼3:羅根》的預(yù)告片,預(yù)測(cè)《洛根》的觀眾可能會(huì)感興趣的其他電影。在20個(gè)預(yù)測(cè)中,有11個(gè)是正確的。
預(yù)測(cè)名單中包括:《X戰(zhàn)警:天啟》、《疾速特攻2》、《奇異博士》、《蝙蝠俠大戰(zhàn)超人:正義黎明》和《自殺小隊(duì)》。一般來說,《洛根》的觀眾想看的是一部擁有“硬漢男主角”的超級(jí)英雄電影。
雖然Merlin的數(shù)據(jù)解釋并不完美,但它確實(shí)是過去十年軟件開發(fā)進(jìn)步的一個(gè)典型例子。為了使程序員能夠更好地專注于改進(jìn)AI算法,未來的軟件開發(fā)必須在減少花費(fèi)在瑣事上的時(shí)間方面制定措施。由于AI旨在專注于單個(gè)任務(wù),因此它是提高程序內(nèi)數(shù)據(jù)分析準(zhǔn)確性的要點(diǎn)。
大數(shù)據(jù)在流媒體網(wǎng)站中的作用
當(dāng)大數(shù)據(jù)的概念在2010年左右首次出現(xiàn)時(shí),有效地改變了將數(shù)據(jù)分析轉(zhuǎn)化為有用洞察和價(jià)值的方法。大數(shù)據(jù)一般來自于外部,使用來自互聯(lián)網(wǎng)、公共數(shù)據(jù)源等位置的信息來進(jìn)行更準(zhǔn)確的預(yù)測(cè)。在娛樂行業(yè)中,大數(shù)據(jù)可用于提供個(gè)性化的用戶體驗(yàn)并降低流媒體網(wǎng)站的觀眾流失率。
看似有海量的電影和電視節(jié)目供用戶選擇,但要留住觀眾對(duì)流媒體服務(wù)和電影制作公司是至關(guān)重要的。如果流失率過高,那就表明公司做錯(cuò)了,通過與機(jī)器學(xué)習(xí)相結(jié)合,大數(shù)據(jù)可以幫助公司識(shí)別問題點(diǎn)出現(xiàn)在哪里。
在流媒體服務(wù)中,用戶界面在觀眾留存中起到了重要作用。例如,如果對(duì)觀眾感興趣的內(nèi)容推薦不準(zhǔn)確,就可能導(dǎo)致觀眾轉(zhuǎn)向其他平臺(tái)。流媒體服務(wù)公司非常清楚,提供一個(gè)好的用戶體驗(yàn)是非常重要的。
為了留住觀眾,Netflix開發(fā)了自適應(yīng)流媒體算法,并持續(xù)改進(jìn)它,以優(yōu)化流媒體質(zhì)量并創(chuàng)建個(gè)性化的用戶體驗(yàn)。該公司會(huì)調(diào)整媒體的音頻和視頻質(zhì)量,以優(yōu)化體驗(yàn);還使用預(yù)測(cè)性緩存來讓視頻更快或更高質(zhì)量地播放。例如,如果觀看者正在觀看一個(gè)系列節(jié)目,則將部分緩存下一集。
從該公司的利潤(rùn)增長(zhǎng)上看,Netflix算法取得了巨大的成功:自2015年以來,Netflix的利潤(rùn)增長(zhǎng)了30%以上,每年的收入達(dá)到166.14億美元。
電影業(yè)的預(yù)測(cè)分析
類似于Merlin這樣的應(yīng)用程序,對(duì)影視市場(chǎng)的預(yù)測(cè)分析的影響是非常大的,但需要更大的數(shù)據(jù)集才能找到準(zhǔn)確的模式。在過去的幾十年中,研究人員收集了數(shù)千部電影和電視節(jié)目的數(shù)據(jù),以尋找可行的預(yù)測(cè)指標(biāo),包括角色類型、情節(jié)復(fù)雜性、明星影響力、預(yù)算或圍繞特定電影的展開的“熱議”和營(yíng)銷活動(dòng)。
從某種意義上說,這種熱議是值得注意的,因?yàn)樾畔碜杂诒姸嗖煌膩碓?,例如社交媒體和批評(píng)性評(píng)論。然而,圍繞電影的熱議只是整個(gè)分析中的一小部分,數(shù)據(jù)分析應(yīng)該涉及電影的每個(gè)生命周期階段,從開發(fā)到后期制作和發(fā)布。
預(yù)測(cè)分析可以幫助創(chuàng)作者,創(chuàng)作公司和管理人員進(jìn)行戰(zhàn)略決策,預(yù)測(cè)趨勢(shì)并更好地了解觀眾的習(xí)慣。知情決策對(duì)電影制作過程至關(guān)重要,獲取高質(zhì)量、高可用性的數(shù)據(jù)是觀眾留存和利潤(rùn)的關(guān)鍵。數(shù)據(jù)科學(xué)家需要不斷思考如何去利用預(yù)測(cè)分析和大數(shù)據(jù),將這些知識(shí)應(yīng)用充分到商業(yè)環(huán)境中。