數(shù)字化的視頻媒體本身就是海量的數(shù)據(jù),隨著人工智能的突破,如何辨識、理解、解析這些內(nèi)容,并通過人工智能提供反饋是目前所有科技巨頭關(guān)注的焦點(diǎn):其中圖像識別、語義識別、情節(jié)和情緒辨識及搜索是各方都正在解決的問題。
人工智能和云計(jì)算正在加速改變各個(gè)行業(yè),而媒體娛樂行業(yè)可能是其中改變最快的一個(gè)。
上周在紐約舉辦的美國廣播電視展覽會(NAB)儼然成為科技巨頭的斗獸場:亞馬遜云服務(wù)AWS、IBM以及谷歌均以主要展商的姿態(tài)出現(xiàn),它們在各個(gè)論壇和技術(shù)討論中向電視臺、電影和廣告公司描述一個(gè)相似的未來。
視頻內(nèi)容不但在云端存儲和播放,其整個(gè)制作流程都將可以依托強(qiáng)大的計(jì)算能力在云端完成;反過來,這些海量數(shù)據(jù)將不斷“訓(xùn)練”人工智能系統(tǒng),自動為媒體提供一系列有價(jià)值的信息:從哈里森福特三十年前出演第一部電影的某個(gè)片段,到哪個(gè)演員、什么樣的劇情才是此刻觀眾更想看到的。
如果當(dāng)家神劇《紙牌屋》的成功證明了大數(shù)據(jù)對內(nèi)容創(chuàng)作的作用,那么奈飛(Netflix)本身的商業(yè)擴(kuò)張更體現(xiàn)了云端和人工智能對媒體的作用:作為第一家將全部視頻內(nèi)容轉(zhuǎn)移到云端的內(nèi)容商, Netflix 通過亞馬遜云AWS服務(wù)擴(kuò)展到了 130 余個(gè)國家,成為真正意義上的全球互聯(lián)網(wǎng)電視網(wǎng)絡(luò)。
在美國廣播電視展覽會上,媒體和科技巨頭正在探討如何將這一趨勢延伸、擴(kuò)大。
“二三十年前,技術(shù)是媒體公司的后臺部門,負(fù)責(zé)修電腦管數(shù)據(jù),但到了現(xiàn)在,媒體本身已經(jīng)變成了科技。”IBM全球媒體和娛樂行業(yè)主管Peter Guglielmino在展會現(xiàn)場向21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示。
數(shù)字化的視頻媒體本身就是海量的數(shù)據(jù),隨著人工智能的突破,如何辨識、理解、解析這些內(nèi)容,并通過人工智能提供反饋是目前所有科技巨頭關(guān)注的焦點(diǎn):其中圖像識別、語義識別、情節(jié)和情緒辨識及搜索是各方都正在解決的問題。
“幾年以前,當(dāng)談到云計(jì)算和人工智能時(shí),不少媒體精英還是一頭霧水,現(xiàn)在所有人都看到了重要性。”Guglielmino表示。
“這是一場系統(tǒng)化的升級,從數(shù)字內(nèi)容的拍攝到上傳,到渲染和剪輯,以及后期人工智能的應(yīng)用,”數(shù)字媒體傳輸和元數(shù)據(jù)采集創(chuàng)業(yè)公司Quine CEO Gunleik Groven向21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示,他認(rèn)為,從云服務(wù)到人工智能,媒體娛樂的智能轉(zhuǎn)型還在開始階段。“不管是亞馬遜谷歌還是IBM,都在盡力搭建一個(gè)更加連通的媒體拼圖。”
轉(zhuǎn)向云端:從why到how
“對媒體來說,對于向云端轉(zhuǎn)移,大家已經(jīng)開始從問為什么,到問怎么做的階段。”Guglielmino表示。
從NAB現(xiàn)場來看,不管是微軟的Azure,還是IBM、谷歌的云服務(wù),都被眾多廠商提及。而說到媒體和云服務(wù)合作的先例,Netflix的故事無法被忽視。
2008年8月,Netflix遭遇嚴(yán)重的數(shù)據(jù)庫損壞事件,連續(xù)三天無法向成員用戶寄送DVD光碟,從那時(shí)起, Netflix意識到,線下數(shù)據(jù)中心的關(guān)系數(shù)據(jù)垂直擴(kuò)展的單點(diǎn)數(shù)據(jù)系統(tǒng)容易發(fā)生問題,必須轉(zhuǎn)向高可靠的、水平擴(kuò)展的云端分布式系統(tǒng)。
從那個(gè)事件到完成轉(zhuǎn)向亞馬遜云端網(wǎng)絡(luò)服務(wù)的真正轉(zhuǎn)換,Netflix花費(fèi)了七年時(shí)間。在2016年1月,Netflix宣布完成了云端的遷移,關(guān)閉所有的自己的流媒體服務(wù)數(shù)據(jù)中心。
遷移到云端已為Netflix帶來多項(xiàng)利益。
一方面是體量。相比于2008 年,他們現(xiàn)在的流媒體用戶增加了七倍,用戶平均觀看時(shí)間同時(shí)提高,八年內(nèi)用戶整體觀看量增長了三個(gè)數(shù)量級。
Netflix本身一直在不斷地迅速演進(jìn),各項(xiàng)功能越來越倚賴新的資源和不斷增長的數(shù)據(jù)體量。要支持這樣迅速的增長僅靠我們自己的數(shù)據(jù)中心已力不從心。云的彈性允許其分分鐘內(nèi)添加數(shù)以千計(jì)的虛擬服務(wù)器和千萬億字節(jié)計(jì)的存儲能力,Netflix充分利用AWS覆蓋全球的服務(wù)云區(qū),動態(tài)調(diào)整服務(wù)網(wǎng)絡(luò),擴(kuò)展全球網(wǎng)絡(luò)服務(wù)能力,竭力為全球成員用戶打造更好、更滿意的流媒體服務(wù)體驗(yàn)。
此外, 云端也提高了Netflix服務(wù)的時(shí)段覆蓋。在本地?cái)?shù)據(jù)中心發(fā)生過數(shù)次故障后,盡管在云端也不可避免地遇到過一些麻煩 , 但整體的時(shí)間覆蓋率一直在穩(wěn)定地提高,幾乎已接近期望中的99.99%不停機(jī)運(yùn)行的目標(biāo)。
建立云上視頻能力
“只有一個(gè)云服務(wù)器是遠(yuǎn)遠(yuǎn)不夠的,更重要的是在這個(gè)基礎(chǔ)上能夠提供怎樣的服務(wù)。”Quine CEO Gunleik Groven表示,“一個(gè)顯著的趨勢是,科技巨頭在馬不停蹄地并購原來細(xì)分媒體領(lǐng)域的服務(wù)公司,以把文件上傳、渲染、轉(zhuǎn)碼等具體視頻媒體技能轉(zhuǎn)化到自己的平臺之中。”
早在2013年,IBM就收購了由私人控股的大文件傳輸技術(shù)公司Aspera。
Aspera的傳輸技術(shù),能夠削減大型數(shù)據(jù)文件的傳輸時(shí)間。一份容量為24GB的大型數(shù)據(jù)文件,如傳輸?shù)降厍蛄硪欢送ǔG闆r下需要26小時(shí),但Aspera的技術(shù)僅需30秒。Aspera采用的高速傳輸技術(shù)名為“fasp”,打破了當(dāng)前制約寬帶傳輸速率的瓶頸。
在Aspera當(dāng)前的客戶當(dāng)中,還有一些視頻服務(wù)商,比如Netflix和環(huán)球影業(yè)等,這些視頻服務(wù)商都不希望自己的數(shù)據(jù)在傳統(tǒng)的網(wǎng)絡(luò)上受阻。
在2015年,亞馬遜以5億美元收購了視頻技術(shù)公司Elemental,將其整合AWS的視頻技術(shù)的一部分,成立了視頻云開放平臺,將視頻云技術(shù)開放給開發(fā)者,實(shí)現(xiàn)視頻的包括接收、轉(zhuǎn)碼和存儲、彈性擴(kuò)容等等諸多與計(jì)算相關(guān)的功能。
今年3月,亞馬遜AWS對Thinkbox軟件進(jìn)行了收購,此次收購意味著:除基本的云計(jì)算服務(wù)外,為其客戶添加更多的實(shí)用性工具,主要是針對視頻和更廣泛的視覺媒體行業(yè)的媒體設(shè)計(jì)和內(nèi)容創(chuàng)建的解決方案。
據(jù)了解,Thinkbox已提供的服務(wù)的示例包括用于渲染管理、幾何緩存和粒子網(wǎng)格劃分的系統(tǒng)以及一系列粒子渲染解決方案的其他工具。其解決方案目前已設(shè)計(jì)用于內(nèi)部部署和基于云的工作。
盡管亞馬遜沒有相關(guān)材料顯示對于Thinkbox的定位,然而基于全球媒體數(shù)字視頻內(nèi)容的大幅增長,相關(guān)猜測認(rèn)為:其將建立和銷售更多服務(wù),開發(fā)企業(yè)轉(zhuǎn)向亞馬遜為其提供后端支持,幫助其不僅提供內(nèi)容,而且創(chuàng)建內(nèi)容。
在各家平臺爭搶視頻公司后,微軟的云平臺Azure也不甘示弱。今年4月,微軟宣布與全球領(lǐng)先的媒體技術(shù)提供商合作,為世界范圍內(nèi)的媒體機(jī)構(gòu)、企業(yè)用戶以及獨(dú)立藝術(shù)家們提供制作、分發(fā)、媒體價(jià)值化的工具。
作為協(xié)議的一部分,Avid選擇 Microsoft Azure作為其首選的云托管平臺,并且將發(fā)展及推出一系列軟件即服務(wù)(SaaS)和平臺即服務(wù)(PaaS)的服務(wù)模式,此服務(wù)架構(gòu)在Avid MediaCentral 平臺之上,它是行業(yè)最開放、整合緊密且高效的平臺,專為媒體行業(yè)而設(shè)計(jì)。
通過建立在行業(yè)最先進(jìn)、最綜合的Avid創(chuàng)意工具和媒體工作流程解決方案之上的基于云的服務(wù),戰(zhàn)略云聯(lián)盟將使媒體機(jī)構(gòu)及創(chuàng)意專業(yè)人士能夠快速及輕松地平衡效率、靈活性及敏捷性——Avid靈活的授權(quán)、部署方式使之成為可能。通過公司新的媒體工作流程、新的操作能力及新的商業(yè)機(jī)會,云還能夠驅(qū)動行業(yè)創(chuàng)新。
人工智能識別能力
把存儲、剪輯等一系列流程都在云上解決并非科技發(fā)展的目標(biāo),運(yùn)用人工智能來分析和識別數(shù)據(jù),更好服務(wù)于內(nèi)容創(chuàng)作才是更重要的。
Peter Guglielmino向21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示,IBM剛剛針對媒體推出了 IBM Waston Media,通過從媒體和娛樂公司的視頻庫內(nèi)容中提取海量數(shù)據(jù),可以讓這些公司對其視頻庫有更深的認(rèn)識。這些海量數(shù)據(jù)包括可視化數(shù)據(jù)(人或物)、文字和音頻提示(標(biāo)注和聲音)、情感提示(語氣)以及其他一些特性如地點(diǎn)等。當(dāng)各媒體和娛樂公司有了這樣的數(shù)據(jù)儲備后,它們能更好地為消費(fèi)者提供參與式體驗(yàn),以及為廣告商提供更好的匹配。
在剛剛過去的9月份美國網(wǎng)球公開賽中,IBM沃森媒體的“識別對焦”(Cognitive Highlight)功能使用人工智能實(shí)時(shí)分析選手和觀眾。在比賽期間,該系統(tǒng)一直在監(jiān)控七個(gè)不同的美國網(wǎng)球公開賽場地,分析球速、球員跑動距離以及觀眾的歡呼次數(shù)等,以便將其分配給“整體興奮”得分。所有這些數(shù)據(jù)都是由沃森處理的,然后將出現(xiàn)在美國網(wǎng)球公開賽應(yīng)用程序和USTA Facebook頁面上。
此外,“Cognitive Highlight”的新功能加入了已“委托”給Watson的任務(wù)列表中,包括收集和分析統(tǒng)計(jì)信息以向電視臺提供信息,積極監(jiān)控美國網(wǎng)球公開賽官網(wǎng)以防范安全威脅,并擴(kuò)大規(guī)模以適應(yīng)比賽前后網(wǎng)絡(luò)流量的大幅增長。
半島電視臺已經(jīng)開始了這樣的嘗試。半島電視臺副臺長阿布格拉認(rèn)為,人工智能和大數(shù)據(jù)很有可能在未來重塑新聞編輯室。阿布格拉指出,大約一年以前,半島電視臺就開始通過面部識別、語音翻譯和情感分析來分析其內(nèi)容,“我們正在搞清楚,那個(gè)家伙到底是怎么生氣的?聲音是什么時(shí)候發(fā)出的?人們在什么時(shí)刻歡呼?”
他表示,增強(qiáng)、豐富元數(shù)據(jù)只能通過一個(gè)非常聰明的人工智能平臺來實(shí)現(xiàn)。“我們盡管擁有大量的內(nèi)容,但無法在沒有云計(jì)算和強(qiáng)大的人工智能的情況下實(shí)現(xiàn)這個(gè)目標(biāo)。”阿布格拉說。
阿布格拉指出,“為了實(shí)現(xiàn)它,我們需要確保我們做出了正確的判斷。有些不是依靠你自己就能實(shí)現(xiàn)的,你需要支持的技術(shù)來幫你重塑思維,甚至做出明智的決定。”
除了應(yīng)用人工智能分析其內(nèi)容外,半島電視臺還在利用大數(shù)據(jù)來挖掘可能隱藏在其20年新聞節(jié)目檔案中的信息。例如,分析員認(rèn)為,一位政治家在某一國家發(fā)表演講時(shí)使用了一個(gè)句子,然后試圖辨別出與他所作出的某項(xiàng)政策決定有關(guān)。“有很多的可能性。”阿布格拉說,“你必須數(shù)字化,然后分析。”
Peter Guglielmino向21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示,從技術(shù)發(fā)展和需求來看,追求高效快捷的新聞和體育是目前媒體系統(tǒng)的最早應(yīng)用,但未來必將深入到廣告、電影、電視制作中。
“內(nèi)容制作是一個(gè)千億市場,每個(gè)人都在加油沖刺。”Guglielmino說。