智能時代,“計算機視覺+普通相機”已經(jīng)不能滿足需求,作為“硬件主體”的相機是時候升級了。
包括計算機視覺、智能語音等在內(nèi),人工智能的分支有很多,其中的“C位”也是變化多樣。
不過落實到市場,人們最終更為關心的依舊是什么技術擁有最多市場,且變現(xiàn)更快?針對這個問題,視覺人工智能技術必然首當其沖。
AI領域占比34.9%、行業(yè)收入排名第一,“視覺”產(chǎn)業(yè)市場可期
最近一段時間,關于“AI換臉”的爭論依然沒有停歇,作為其中“主角”的視覺人工智能技術也是備受爭議。不可否認,這一應用背后數(shù)據(jù)隱私的安全問題不容忽視,但從另一方面,人們還能看到視覺人工智能技術的落地之“容易”。
清華大學曾有數(shù)據(jù)顯示,在技術層面,視覺人工智能的應用在整個AI應用領域中的占比已經(jīng)達到了34.9%,成為各行業(yè)發(fā)展的重要支撐之一。
截至目前,視覺人工智能技術已經(jīng)在多個領域?qū)崿F(xiàn)了落地,以安防為例,在政府對“智能安防”、“智慧城市”的大力推動下,道路監(jiān)控、小區(qū)/學校安全監(jiān)控、各類門禁等皆成為了視覺人工智能技術的落地場景。
中國信通院有數(shù)據(jù)統(tǒng)計,視覺人工智能技術在2017年憑借80億元的收入排名AI的行業(yè)第一,時至今日,當初的數(shù)據(jù)也已經(jīng)發(fā)生了變化。2018年,視覺人工智能的市場規(guī)模已經(jīng)突破了100億元,預計今年的規(guī)模將進一步擴大至300億元,另有數(shù)據(jù)預計,這一市場的年均復合增長率將達到125.5%,預計2020年的市場規(guī)模將達780億元。
根據(jù)不同的統(tǒng)計標準和衡量維度,各調(diào)查機構(gòu)的數(shù)據(jù)肯定是有所不同的,但無一例外的是,視覺人工智能市場還在繼續(xù)快速增長,市場前景可期。
除了各調(diào)查機構(gòu)的數(shù)據(jù)預期,依據(jù)資本流向也可看出某個特定市場的被看好。比如視覺人工智能,這一產(chǎn)業(yè)在2017年獲得了超過230億元的融資,在中國人工智能領域的投資當中占比超過三分之一,被稱為人工智能領域“最吸金”的產(chǎn)業(yè)。在被稱為“資本寒冬”的2018年,這一金額非但沒有降低,更是高出近30億元,達到了260億元,可見這一市場的“吸金”程度。
到了2019年,視覺人工智能的產(chǎn)業(yè)熱度依舊沒有下降:應用方面,視覺人工智能繼續(xù)在安防、智能制造、娛樂、營銷等多個應用場景中落地開花;融資方面,近乎每周都有相關企業(yè)獲得資本青睞,就在日前,雙目立體視覺技術提供商小覓智能在Pre-B輪融資中獲得由江蘇民營投資控股有限公司投資的數(shù)千萬元。
視覺人工智能的本質(zhì):讓機器“看得清”、“看的準”
市場層面,視覺人工智能的前景是無疑是可以期待的。為什么這一技術能夠擁有這么大的產(chǎn)業(yè)規(guī)模?因為客戶有需求。
以智能機器人為例,這一AI時代下的產(chǎn)物需要能夠面向人類提供智能服務,譬如餐廳里的服務機器人需要做到端茶送水、工廠里的工業(yè)機器人需要能夠?qū)a(chǎn)品精準拼接等等。在智能時代,機器人已經(jīng)不再是過往孩童拿在手上把玩的玩具,而是一個功能性自動化工具。
面對來自市場的需求,為了提供更好的自然人機交互體驗和智能服務,眼睛、耳朵、嘴巴已經(jīng)成為當下機器人的標準配置。
數(shù)據(jù)統(tǒng)計,2019年全球機器人市場規(guī)模預計將達到294.1億美元,由此來進行推斷,機器人對于“視覺”的需求可想而知。
了解到市場有需求之后,新的問題又來了:市場對于“視覺”的需求究竟是什么?總結(jié)下來,無非是看得見、看得清、看得準三點。這其中,“看得見”是最簡單的,一個最為普通的攝像頭就可以做到,而“看得清”和“看得準”就沒那么簡單了,要求機器能夠做到精準識別和避障。
在這件事情的實施上,僅僅依賴“計算機視覺+普通相機”是不可行的,其中作為硬件且不可缺少的相機是時候進行升級了。針對這一點,業(yè)內(nèi)的主流偏好是“深度相機”,具體解決方案包括結(jié)構(gòu)光、TOF、雙目等等,在最終的效果上各有優(yōu)劣。
細細來看,TOF和結(jié)構(gòu)光都屬于主動光,易受可見光和物體表面干擾,更適用于室內(nèi)和短距離的應用場景,而純雙目適用于室內(nèi)外,測量范圍更大,但不適用于無紋理物體和全黑環(huán)境中物體的識別。基于此,一些公司選擇將不同的解決方案相結(jié)合,實現(xiàn)效果的疊加。
這其中,雙目結(jié)構(gòu)光這一組合被更多的公司看好?;谶@一組合,機器可以做到無障礙識別室內(nèi)白墻等無紋理物體,同時適用于室內(nèi)外和黑暗場景。不過這一組合方案并不是完美的,比如識別精度還不夠高,對于這個問題,各家也有自己不同的解決方案。
這方面,小覓智能的做法是在雙目結(jié)構(gòu)光這一組合中加入慣性導航,后者可以為既有VSLAM的應用提供精動的云端互補數(shù)據(jù),在效果上相比其他方案擁有更高精度和高魯棒性,讓機器看得清、看的準,實現(xiàn)精準定位與導航。
當能夠看得見、看得清、看的準之后,機器就具備了基本的“視覺”感知能力,做到定位導航和三維避障,從而實現(xiàn)自主移動和環(huán)境感知等功能。
如何商業(yè)化落地,一道不得不解答的問題
可以看到,從去年到今年,“商業(yè)化落地”就成為了一道擺在AI創(chuàng)企面前,且不得不做出解答的題目。至于最終的答案如何判定?這個還得交給市場。
就目前而言,雖然視覺人工智能領域內(nèi)涌現(xiàn)的獨角獸企業(yè)越來越多,也不乏新入玩家,但當談及商用化落地,即使是獨角獸,也不一定能給出一個很好的解決方案。
究竟什么樣的產(chǎn)品才能夠更快被用戶接受,并在市場實現(xiàn)落地?從鎂客網(wǎng)過往的采訪來看,企業(yè)的回答是多種多樣的,但繞來繞去終究逃不過三點:高性價比、高效、服務完備。
就“視覺”而言,算法平臺的收費大同小異,彼此之間的落差并不是太大,客戶最大的支出在于“硬件”這一塊。眾所周知,相比于激光雷達等,基于相機的視覺導航在成本和計算方式上擁有顯著優(yōu)勢?;陔p目、結(jié)構(gòu)光等技術,相機不僅僅能夠?qū)崿F(xiàn)視覺定位導航,還能做深度識別與跟蹤等等,做到以低成本實現(xiàn)高效用。
與此同時,依據(jù)近一兩年的市場局勢來看,“軟硬件一體化”或“軟硬件結(jié)合”正在成為視覺人工智能的一種新的趨勢。過往,視覺人工智能企業(yè)更多的是提供軟件平臺層的服務,讓客戶通過調(diào)用API接口等方式實現(xiàn)人臉識別、精準定位等等。發(fā)展到現(xiàn)在,這種僅僅基于軟件平臺的服務模式正在潛移默化的發(fā)生變化,一些以往提供這一類服務的公司漸漸地開始涉足硬件產(chǎn)業(yè),研發(fā)并提供相機等終端硬件產(chǎn)品,
這一前提下,諸如小覓智能這些早早涉足軟硬件一體化的公司逐漸開始嘗到甜頭。眼下,小覓智能已有超過5款雙目標準模組產(chǎn)品在市場上銷售,包括小覓雙目攝像頭標準版、小覓雙目攝像頭標準彩色版、小覓雙目攝像頭深度版、小覓雙目攝像頭深度Mobile版等。落地上,包括服務機器人、掃地機器人、安防機器人、無人車、無人機和輔助駕駛ADAS在內(nèi)都能夠成為小覓智能產(chǎn)品的應用場景。
不過需要注意的是,產(chǎn)品質(zhì)量把控一直是硬件產(chǎn)品研發(fā)商最為需要關注的問題之一。硬件產(chǎn)品產(chǎn)業(yè)鏈覆蓋了多個產(chǎn)業(yè)圈,若企業(yè)想要在產(chǎn)品成效、質(zhì)量上實現(xiàn)更好地把控,所能做的就是盡可能的讓自身覆蓋產(chǎn)業(yè)上中下游。
圍繞這個問題,小覓智能也是類似考量。目前,他們已經(jīng)打通“芯片+模組+硬件+產(chǎn)品”的完整產(chǎn)業(yè)鏈,包括在FPGA上實現(xiàn)的雙目深度計算、以雙目為核心的三維視覺模組、VIO視覺里程計、VSLAM視覺定位導航、3D避障、行業(yè)解決方案等。這意味著,小覓智能已經(jīng)能夠從根源處開始著手,把控產(chǎn)品的關鍵流程。
眼下,在商用服務機器人、物流移動機器人、掃地機器人、體積測量等領域,小覓智能已經(jīng)與一些頭部企業(yè)相繼簽訂了合作協(xié)議。就目前而言,機器人等多個領域?qū)τ?ldquo;視覺”都有著極大的需求,小覓智能能不能拿下更多市場,依照目前的產(chǎn)品和客戶矩陣,值得期待。