當前,互聯(lián)網(wǎng)已經(jīng)成為了我們工作生活中不可或缺的部分,人們利用互聯(lián)網(wǎng)搜尋信息、社會交往、消費購物、協(xié)作辦公,大幅提高了人們的生活質量和工作效率。從互聯(lián)網(wǎng)的發(fā)展歷史來看,信息傳遞速率和信息處理能力的大幅提升會帶來互聯(lián)網(wǎng)的巨大變革。最為典型的例子就是移動互聯(lián)網(wǎng)帶來的繁榮。
自從3G等移動通訊技術投入使用和手機芯片處理能力大幅提升,可以隨取隨用的移動設備(主要是手機)取代了傳統(tǒng)的家用電腦,將人們與互聯(lián)網(wǎng)更緊密的結合在了一起,產(chǎn)生了諸多基于移動端的商業(yè)模式(如共享經(jīng)濟),也給人們的生活工作方式帶來了很大變化(手機打車、刷抖音、手機打卡等)。那么,面臨即將到來的5G+AI時代,互聯(lián)網(wǎng)又會迎來怎樣的巨大變革,對經(jīng)濟社會和身處其中的每個個人又會帶來怎樣的變化呢?
有一些觀點認為,移動智能時代的下一步是可穿戴式智能時代。以眼鏡為代表的下一代可穿戴式智能設備將取代手機等設備,成為更為便利的互聯(lián)網(wǎng)節(jié)點,引領下一代互聯(lián)網(wǎng)的潮流。
但仔細思索不難發(fā)現(xiàn),上述的觀點僅反映了硬件層面的迭代,還缺乏對于軟件層面迭代的思考。畢竟人需要一定的渠道和方式去與眼鏡等下一代智能設備溝通,而且這種溝通在新技術的支持下必然是與當前移動智能設備與人的交互方式是不同的。
我們認為從軟件層面看,在5G+AI支持下,下一個互聯(lián)網(wǎng)時代將是基于視頻的時代,視頻將成為連接人與下一代智能設備、人與互聯(lián)網(wǎng)的重要媒介,進而形成以視頻作為主要信息傳遞介質和功能載體的互聯(lián)網(wǎng)形態(tài)。我們將這一代互聯(lián)網(wǎng)稱之為“視聯(lián)網(wǎng)”。接下來我們將從三個方面來論述“視聯(lián)網(wǎng)”,一是“視聯(lián)網(wǎng)”為何代表了互聯(lián)網(wǎng)的下一代發(fā)展方向;二是5G+AI如何助力“視聯(lián)網(wǎng)”的發(fā)展;三是“視聯(lián)網(wǎng)”會帶來什么影響。
“視聯(lián)網(wǎng)”是互聯(lián)網(wǎng)的發(fā)展趨勢
技術的發(fā)展是以人為核心的,有的技術是為滿足人的需求提供便利,有的則為人賦能,使人做到原本做不到乃至想不到的事情?;ヂ?lián)網(wǎng)的發(fā)展也是如此,為人的工作、生活提供便利和賦能是互聯(lián)網(wǎng)發(fā)展的核心要義。相較于圖文、語音等形式,以視頻作為主要的信息傳遞介質和功能載體可以為人帶來更多的便利。
視頻作為信息傳遞介質可以傳遞更多交互信息
視頻是對一系列靜態(tài)影像(每秒24幀以上)加以捕捉、記錄、處理、存儲、傳輸和重現(xiàn)的技術,可以簡單理解為一種信息的記錄與傳輸方式。對比文字、圖片、語言等信息傳輸方式,視頻最大的優(yōu)勢在于其具有最大的信息帶寬,在信息處理速度和傳輸速度足夠的情況下,單位時間內視頻可以傳遞的信息更多。同時,視頻中可以輕易的加載音頻和文字,形成多渠道的信息傳輸,彌補單一渠道的不足,反之則不行。這些優(yōu)勢也就決定了視頻可以使得人與計算機、人與人之間的交互更為便利、真實、更符合人與生俱來的習慣。
視頻的高帶寬使其不僅能傳遞語言和圖文能夠表達的明示信息,更能傳遞其他形式較難表達的默會信息,例如人的情感。人與人面對面的交流要比單純的電話交流更能了解一個人的精神狀態(tài),就是因為人的視覺能夠接收到的信息要遠大于通過語言表達接收到的信息,例如表情、動作等,從而分析出對面人所表現(xiàn)出的情感。視頻也是如此,通過視頻能夠更為便利的實現(xiàn)不同時空的人與人的情感交流。
視頻這一特點已被廣泛應用,影視劇作之所以吸引人,是因為其沉浸感和代入感更能引起人的情感共鳴。越來越多的企業(yè)采用網(wǎng)絡視頻形式傳播企業(yè)形象,也是為了通過視頻中的情感交流建立與觀看者的信任感,樹立品牌形象。目前,視頻內容已經(jīng)占據(jù)了互聯(lián)網(wǎng)數(shù)據(jù)總量的80%,并且有越來越多的APP開始加載視頻功能。即便沒有任何技術與應用突破,預計到2022年視頻內容的數(shù)據(jù)總量也將達到82%。這都表明視頻在促進人與人交互中的作用得到了廣泛的認可。
視頻作為互聯(lián)網(wǎng)功能載體可以帶來更多使用便利
而隨著視頻成為人們休閑娛樂和信息傳遞的主要方式,以及人們觀看視頻時間的增長,讓視頻承載互聯(lián)網(wǎng)的功能服務就能夠為人們帶來更多的便利。這種便利就是視頻作為互聯(lián)網(wǎng)入口的價值。
從當前觀看視頻的體驗出發(fā),很多人都有這樣的感受,感覺視頻中引起你情感共鳴的點缺乏合適的方式去宣泄。設想如下的場景,在看球賽時看到球星進球后想買雙他的球鞋珍藏;在看到《權利與游戲》大結局時有無數(shù)吐槽不吐不快;刷抖音時看到別人分享的旅游地標想進一步了解具體信息。在當下,我們碰到以上的場景,唯一的辦法是退出視頻,打開淘寶搜索球星球鞋;打開微博和微信瘋狂吐槽;打開百度搜索旅游地標的信息。在這個退出視頻、登錄其他軟件的過程中,不可避免的會給人帶來不便。一方面是視頻中的信息并不一定能準確傳遞到其他功能軟件中,就比如球鞋在淘寶上有多款類似的,你并不能確定哪一款是當時球星腳上穿的引起你購買欲的那款;另一方面是這個轉換過程會破壞人的情緒積累,就比如一個人關掉視頻打開微信準備吐槽時,看到微信的界面和朋友圈新鮮的事件,注意力就發(fā)生了轉移,可能也就放棄了繼續(xù)吐槽,抑或吐槽力度有所降低。如果視頻能夠直接承載互聯(lián)網(wǎng)功能,滿足人們視頻內購物、社交、搜索等種種需求,想必會給人帶來極大的便利。
如果我們把目光放的更為長遠,在可穿戴式智能設備時代,AR和VR技術得到廣泛應用,視頻作為互聯(lián)網(wǎng)功能載體將為人們帶來更大的便利。當人們帶上智能眼鏡后,本質上是將攝像頭捕捉到的視頻信息以虛擬層的形式與人看到的真實世界進行重合,進而可以在兩者間展開豐富的互動,但這種互動肯定是零轉換、低延時的。比如當你想買路邊某人的同款外套時,你肯定希望看到后直接在眼鏡虛擬層上彈出價格、款式等相關信息、確認后就一鍵下單,而不是虛擬層先關閉視頻模式再跳轉到淘寶頁面獲得商品信息。
“視聯(lián)網(wǎng)”發(fā)展的難點
要實現(xiàn)以視頻作為主要的信息傳輸介質和互聯(lián)網(wǎng)功能載體的“視聯(lián)網(wǎng)”,主要有三個難點。一是有足夠高的帶寬便于視頻傳輸。二是精準的視頻識別技術,準確找出引發(fā)人們需求的信息。三是視頻互動技術,在兼顧視頻體驗的情況下實現(xiàn)人與視頻、視頻與互聯(lián)網(wǎng)功能服務的互動。
第一點比較好理解,視頻內容由于信息量大,需要足夠高的帶寬才能順利觀看。而視頻越精致、承載的互聯(lián)網(wǎng)功能越多,自然也就需要更高的帶寬用于傳輸。
第二點視頻識別技術是最為核心的難點。視頻內容是非結構化信息,是無法通過計算機直接讀取獲得我們所需要的人物、物品、場景、地標等信息的,也就無法準確定位可能引起人們需求的那些信息。視頻就好像一個黑箱,只能從外部觀看,卻無法看到內部裝著的東西。最笨的識別辦法是通過人力將視頻中可能引起需求的信息進行標注,就好比人用手伸進黑箱,把其中的內容一件件取出來,這樣也能解決視頻識別的問題。但對于浩如煙海的視頻數(shù)據(jù)量,人力是完全無法滿足的。
第三點的關鍵在于如何在盡可能少的影響視頻體驗的情況下承載最多的互聯(lián)網(wǎng)功能,并且需要根據(jù)人們的使用習慣不斷優(yōu)化。同時,隨著視頻識別技術的發(fā)展,視頻中蘊含的信息識別出的越多,人們與視頻互動或與互聯(lián)網(wǎng)功能的互動就會越多,對于互動技術的要求也就相應提高。
5G+AI正在助力“視聯(lián)網(wǎng)”實現(xiàn)
我們認為,5G的應用與AI技術的高速發(fā)展能夠很大程度上解決上述的三個難點,打通“視聯(lián)網(wǎng)”實現(xiàn)的主要障礙。
5G與AI技術帶來的突破
讓我們先來簡單分析一下5G和AI技術的發(fā)展意味著什么。5G是新一代信息傳輸技術,具有高寬帶、低延時的特點,簡單而言就是把現(xiàn)在的無線網(wǎng)絡傳輸速度增加十倍、反應速度縮減到十分之一。AI技術,或者說當前以神經(jīng)網(wǎng)絡算法為核心的AI技術,其本質是高效的記憶與識別。通過AI技術,計算機可以用比人類快幾萬倍的速度讀取數(shù)據(jù)(本質就是記憶),并找出大量數(shù)據(jù)間的相關性(識別),甚至找出人腦無法識別的關聯(lián)。
5G很快就要投入應用,這將很大程度上解決視頻傳輸?shù)膸拞栴}。以上海為例,根據(jù)上海去年11月發(fā)布的《上海市推進新一代信息基礎設施建設助力提升城市能級和核心競爭力三年行動計劃(2018-2020年)》,上海將會在2020年底率先完成“雙千兆寬帶城市”建設,屆時,移動網(wǎng)絡用戶感知速度可以達到500M/S,固定寬帶網(wǎng)速達到千兆。一部無壓縮的藍光電影大約25G左右,用移動網(wǎng)絡也就一分鐘不到即可下載完成。視頻作為信息傳輸介質的通訊阻礙已經(jīng)可以基本排除。
AI技術的發(fā)展則可以為視頻識別提供極大幫助。通過AI算法可以實現(xiàn)計算機自動識別視頻中的海量信息,以計算機超過人類數(shù)萬倍的速度去標識出視頻中的可用信息,甚至做出人難以理解卻準確的識別判斷。AI技術已經(jīng)在安防、金融、智能駕駛和視頻廣告投放等垂直領域中有了充分的應用,基于視頻識別的部分需求得到了一定滿足。盡管現(xiàn)有的技術還難以全面解析視頻中的所有信息,但其發(fā)展前景使視頻內容完全識別成為了可能。在未來,隨著視頻AI識別技術變得更快速、更精準、更低成本,視頻內容的實時解析也并非難以做到,或許那時就能達到智能眼鏡的時代。
至于視頻互動技術,相較于技術研發(fā),視頻互動更為重要的是互動生態(tài)的建立。視頻內容的生產(chǎn)、傳播者和互聯(lián)網(wǎng)服務提供商需要認可視頻觀看者的互聯(lián)網(wǎng)需求,打開數(shù)據(jù)鏈路,實現(xiàn)互聯(lián)網(wǎng)生態(tài)在視頻層的對接。這需要的是有效的商務推廣、龍頭帶動效應和不斷的體驗優(yōu)化。
“視聯(lián)網(wǎng)”發(fā)展的四個階段
隨著5G和AI技術的不斷成熟與應用,我們設想了“視聯(lián)網(wǎng)”發(fā)展的四個階段:
首先是“嬰兒期”,即5G和AI的初步應用,也是當下我們所處的階段。這一階段中,視頻AI技術實現(xiàn)了對視頻內容的初步解構,形成了包括內容、情景、事件等結構化數(shù)據(jù)?;谶@些結構化數(shù)據(jù),可以實現(xiàn)視頻與用戶的初步互動,滿足用戶的有限需求。AI場景廣告就是一種初級應用形態(tài),實現(xiàn)了場景購買需求與購買渠道的對接。這一時期的“視聯(lián)網(wǎng)”功能是初級的、有限的,所有的參與者都是“視聯(lián)網(wǎng)”的嘗鮮者。
再次是“成長期”,即5G和AI的廣泛應用。隨著AI技術越來越強,視頻中的信息已經(jīng)可以做到全面解析,“視聯(lián)網(wǎng)”能夠帶來的價值清晰可見。“視聯(lián)網(wǎng)”的嘗鮮者獲得了足夠的收益,大量跟風者開始出現(xiàn)。從視頻中直接獲取信息逐漸成為用戶的基本行為習慣,?如在視頻中直接點擊即可獲取演員的姓名和屬性,直接點擊地標景點即可獲取旅游信息等將成為視頻的最基礎功能。視頻內的對象與信息成為了人與互聯(lián)網(wǎng)交互的?個重要?口。
之后是“青年期”,即“視聯(lián)網(wǎng)”生態(tài)的形成。隨著視頻作為互聯(lián)網(wǎng)?口得到普遍認可,?量互聯(lián)網(wǎng)公司將其服務以“視頻小程序”的形式遷移到視頻之中,而不僅僅是接入外部鏈接,從?形成了完整的“視聯(lián)網(wǎng)”?態(tài)。到此時,視頻就已經(jīng)完成了從媒體到介質的轉化,出現(xiàn)了“視頻操作系統(tǒng)”,真正實現(xiàn)了“視頻即桌面”的一次互聯(lián)?進化。
最后是“成熟期”,“視聯(lián)網(wǎng)”生態(tài)與可穿戴式智能設備達到了深度結合,并隨著智能眼鏡的普及達到了巔峰,在這一時期,人們的感官成為了互聯(lián)網(wǎng)的接口,“視聯(lián)網(wǎng)”也實現(xiàn)了從“視頻”到“視覺”的跨越。這一基于自然感官的系統(tǒng)可以稱為“自然操作系統(tǒng)”。
再之后,“視聯(lián)網(wǎng)”可能會被更為便利的模式所替代?;ヂ?lián)網(wǎng)的發(fā)展不會停止,會向著更為便利和符合人類自然習慣的方向發(fā)展。可能在“視聯(lián)網(wǎng)”之后,人們就實現(xiàn)了通過神經(jīng)傳輸數(shù)據(jù),進入了腦機時代。此處就不做贅述。
“視聯(lián)網(wǎng)”的影響猜想
“視聯(lián)網(wǎng)”會帶來哪些影響?這個問題在沒有發(fā)生前我們只能做一些大致的猜想。
視頻作為信息介質帶來的影響:對圖文生態(tài)的顛覆
圖文制作與視頻制作融合
可以想見,當視頻的內容信息可以完全識別和解析后,圖文表現(xiàn)形式可以完全被視頻表現(xiàn)形式所取代。當然這并不意味著人們不再需要圖文形式的內容,而是說人們完全可以用制作視頻的方式制作圖文內容,人們對于需要的圖文信息可以輕松的去蘊含該信息的視頻中提取出來,而傳統(tǒng)的圖文制作可能將會成為視頻制作軟件中的一個基礎服務。
圖文系統(tǒng)被視頻系統(tǒng)取代
圖文信息形式被視頻形式所取代并將帶來整個系統(tǒng)生態(tài)的劇烈變化,最為顯著的變化莫過于當前計算機的圖文操作系統(tǒng)會被視頻操作系統(tǒng)所取代。這種變化類似于當年Windows的圖文操作系統(tǒng)取代DOS的文字操作系統(tǒng),操作系統(tǒng)的迭代會大幅改變人們使用計算機的習慣,衍生出大量新的內容和服務。
圖文服務向視頻服務進化
在視頻操作系統(tǒng)上的服務可能會分為兩類,一類是原有圖文服務的視頻化移植。就比如谷歌做的搜索服務,在“視聯(lián)網(wǎng)”時代也十分需要,當然服務內容會有變化,主要搜索對象可能變成視頻幀或視頻中的某個元素。另一類是無法想象的、基于視頻系統(tǒng)的原生服務。這需要根據(jù)人們在實際使用“視聯(lián)網(wǎng)”的過程中逐步發(fā)掘與創(chuàng)新。
視頻作為互聯(lián)網(wǎng)功能載體帶來的影響
互聯(lián)網(wǎng)入口的全新競爭
“視聯(lián)網(wǎng)”中,視頻作為互聯(lián)網(wǎng)的主要入口將會引爆新一輪的入口競爭。很可能不同于過去門戶網(wǎng)站、APP等功能性入口,“視聯(lián)網(wǎng)”時期的入口更可能是基于內容層面的,是通過視頻內容來吸引流量,進而從內容出發(fā)延伸出其他互聯(lián)網(wǎng)功能。影響視頻內容的可能包括分辨率、內容解析度、共鳴度等各類硬性和感性的標準,形成更為垂直分化的用戶群體。從這一點出發(fā),視頻內容的提供商可能將成為“視聯(lián)網(wǎng)”中的重要角色。
“視聯(lián)網(wǎng)”的行業(yè)標準之爭
視聯(lián)網(wǎng)中的各類服務是通過小程序形式加載在視頻中,從而實現(xiàn)零轉換和低延時。為了讓各類小程序有序開發(fā)并應用在各類格式的視頻中,相關的行業(yè)標準建立將是重要一步,必將成為巨頭們競爭的焦點,就像ios系統(tǒng)與安卓系統(tǒng)的競爭一般。在這一過程中,“視聯(lián)網(wǎng)”的嘗鮮者們或許有一次提前入局的機會。就好似抓住互聯(lián)網(wǎng)風口的阿里巴巴、抓住移動互聯(lián)網(wǎng)風口的Uber,“視聯(lián)網(wǎng)”的風口也將孕育出一批新的巨頭。