計算機視覺正在促進(jìn)人工智能行業(yè)的高速發(fā)展

樂晴智庫
樂晴智庫
計算機視覺能極大提升機器的圖像感知能力和認(rèn)知能力,因此應(yīng)用場景十分廣闊,商業(yè)化變現(xiàn)空間大。

中央明確指示要加快推進(jìn)國家規(guī)劃已明確的重大工程和基礎(chǔ)設(shè)施建設(shè),其中要加快 5G 網(wǎng)絡(luò)、數(shù)據(jù)中心等新型基礎(chǔ)設(shè)施建設(shè)進(jìn)度。相比于傳統(tǒng)的"鐵公基",新基建是立足于高新科技的基礎(chǔ)設(shè)施建設(shè),主要包括5G基建、特高壓、城際高速鐵路和城市軌道交通、新能源汽車充電樁、大數(shù)據(jù)中心、人工智能、工業(yè)互聯(lián)網(wǎng)等七大領(lǐng)域。

當(dāng)前人工智能理論和技術(shù)日益成熟,應(yīng)用范圍不斷擴(kuò)大,產(chǎn)業(yè)正在逐步形成、不斷豐富,相應(yīng)的商業(yè)模式也在持續(xù)演進(jìn)和多元化。據(jù)IDC統(tǒng)計,2018年我國人工智能市場規(guī)模為161.9億元,預(yù)計到2022年市場規(guī)模將接近700億元,年復(fù)合增長率超過50%。據(jù)中國人工智能學(xué)會和羅蘭貝格咨詢公司預(yù)測,2025年市場規(guī)模將達(dá)到3萬億美元。

以深度學(xué)習(xí)為代表的人工智能算法的出現(xiàn)極大推動了視覺人工智能行業(yè)的發(fā)展。計算機視覺是人工智能行業(yè)的最大組成部分,與其他細(xì)分的比較來看,計算機視覺技術(shù)應(yīng)用的市場規(guī)模也遠(yuǎn)遠(yuǎn)大于其他細(xì)分。

計算機視覺(Computer Vision) 人工智能主要應(yīng)用領(lǐng)域之一,起源于20世紀(jì)80年代的神經(jīng)網(wǎng)絡(luò)技術(shù),通過使用光學(xué)系統(tǒng)和圖像處理工具等來模擬人的視覺能力捕捉和處理場景的三維信息,理解并通過指揮特定的裝置執(zhí)行決策。2015年以來,全球科技界和產(chǎn)業(yè)界高度重視視覺人工智能研究和應(yīng)用,在核心技術(shù)和產(chǎn)業(yè)化應(yīng)用的研發(fā)投入持續(xù)倍增。

計算機視覺能極大提升機器的圖像感知能力和認(rèn)知能力,因此應(yīng)用場景十分廣闊,商業(yè)化變現(xiàn)空間大。

根據(jù)前瞻產(chǎn)業(yè)研究院的統(tǒng)計,國內(nèi)人工智能企業(yè)中,有高達(dá)42%的企業(yè)應(yīng)用計算機視覺相關(guān)技術(shù),其次是語音和自然語言處理,分別占比24%、19%,兩者之和才與計算機視覺占比相當(dāng)。在安防影像分析、泛金融身份認(rèn)證、手機和互聯(lián)網(wǎng)娛樂、批發(fā)零售商品識別、工業(yè)制造、廣告營銷、自動駕駛、醫(yī)療影像分析等領(lǐng)域都具有巨大應(yīng)用價值。

視覺人工智能行業(yè)的發(fā)展,離不開技術(shù)的驅(qū)動:一方面諸如GPU、FPGA、ASIC等一系列AI芯片的出現(xiàn)極大提升了芯片計算能力,突破了傳統(tǒng)CPU的算力瓶頸;另一方面以深學(xué)習(xí)為代表的AI算法的崛起,使得AI視覺的識別能力有了很大的提高。硬件算力的提升以及軟件算法的進(jìn)步都對視覺人工智能的發(fā)展起到了重要的推動作用。

計算機視覺的工作流程包含四個模塊:檢測、分類、跟蹤與語義分割。具體為成像設(shè)備首先捕獲圖像,然后對每個圖像進(jìn)行預(yù)處理,提取特征后輸入到分類模型中。

計算機視覺是采用圖像處理、模式識別、人工智能技術(shù)相結(jié)合的手段,著重于一幅或多幅圖像的計算機分析。

圖像可以由單個或者多個傳感器獲取,也可以是單個傳感器在不同時刻獲取的圖像序列。在消費級領(lǐng)域,隨著數(shù)據(jù)量上漲、運算力提升和深度學(xué)習(xí)算法的發(fā)展,計算機視覺技術(shù)越來越多地被應(yīng)用在各類消費級應(yīng)用場景中,典型的如人臉識別服務(wù),具體包括人臉檢測、人臉關(guān)鍵特征點、人臉對比、人臉?biāo)阉?、人臉屬性、人臉聚類、人力活體檢測等。

計算機視覺實現(xiàn)了計算機“看得懂”,人臉識別、OCR和圖像結(jié)構(gòu)化是其主要應(yīng)用場景。計算機視覺是用計算機模擬人眼對目標(biāo)進(jìn)行識別、跟蹤和測量,并且對圖形進(jìn)行處理,即實現(xiàn)計算機“看得懂”。

根據(jù)億歐智庫《2019計算機視覺人臉識別市場研究報告》顯示,2018年中國計算機視覺人臉識別市場規(guī)模為151.7億元,預(yù)計2021年將達(dá)530億元,年均復(fù)合增長率53%,市場規(guī)模增長迅速。

計算機視覺行業(yè)產(chǎn)業(yè)鏈由上游基礎(chǔ)層、中游技術(shù)層以及下游應(yīng)用層組成。

上游基礎(chǔ)層基礎(chǔ)層:主要包括CPU、GPU等芯片硬件,深度神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)等算法,以及由真實數(shù)據(jù)和模擬數(shù)據(jù)共同構(gòu)成的數(shù)據(jù)集。核心芯片被Intel、Nvidia等傳統(tǒng)芯片廠商把控,新型芯片廠商尚未崛起,規(guī)模應(yīng)用有待時日;開源平臺以谷歌的Tensorflow、Facebook的Caffe等為主,其它企業(yè)的深度學(xué)習(xí)框架多為二次開發(fā);

中游技術(shù)層主要包括視頻識別、圖片識別、模式匹配等嵌入式視覺軟件,以及一站式解決方案。算法,初創(chuàng)企業(yè)占優(yōu);云計算,幾乎被AWS、Google Cloud、Azure、阿里云等壟斷。

下游應(yīng)用層:為計算機視覺的落地場景,包括智慧安防、智慧金融、手機應(yīng)用、無人駕駛等商業(yè)領(lǐng)域。垂直行業(yè)龍頭占據(jù)場景,技術(shù)層初創(chuàng)企業(yè)向上滲透。

國內(nèi)計算機視覺的玩家有三類:

1.??低?、大華股份、宇視科技等安防廠商

安防影像分析的市場需求驅(qū)動此類企業(yè)的技術(shù)研發(fā)。在云邊融合的架構(gòu)下,近年來安防行業(yè)頭部廠商紛紛推出自家智能化產(chǎn)品和解決方案。

作為人工智能范疇中最關(guān)鍵的子領(lǐng)域之一(人類從外界獲取的信息中有80%~85%是依靠視覺實現(xiàn)的),計算機視覺技術(shù)的愿景是利用攝像機等視覺傳感裝置來代替人眼對物體進(jìn)行識別、跟蹤和測量,再由計算機處理這些視覺信息,從而達(dá)到像人眼一樣對事物進(jìn)行感知和認(rèn)知,直接對應(yīng)安防監(jiān)控系統(tǒng)“看得懂”的需求。

2.互聯(lián)網(wǎng)巨頭公司

近年來基于深度學(xué)習(xí)的智能語音、計算機視覺、自然語言處理等技術(shù)開始向各個應(yīng)用領(lǐng)域滲透,全球人工智能產(chǎn)業(yè)規(guī)??焖僭鲩L。為搶占人工智能高地,谷歌、微軟、阿里巴巴、百度、騰訊、IBM、Facebook 等國際知名企業(yè)均持續(xù)增加在人工智能領(lǐng)域的資本投入。美國、中國、英國、德國、日本等國家也分別出臺人工智能相關(guān)支持政策及國家戰(zhàn)略規(guī)劃,為整個產(chǎn)業(yè)的發(fā)展創(chuàng)造良好的政策環(huán)境。

3.創(chuàng)業(yè)公司:包括商湯科技、依圖科技和曠視科技等企業(yè),普遍以細(xì)分領(lǐng)域為發(fā)力點,布局思路各異。

在商湯、曠視、依圖等頭部企業(yè)看,各家戰(zhàn)略思路差異明顯。商湯致力于構(gòu)造平臺,專注底層基礎(chǔ)應(yīng)用,力圖在完善平臺后于其他領(lǐng)域快速落地。曠視則在致力于在安防、金融、零售、汽車、教育等廣泛領(lǐng)域提供軟硬件一體化的解決方案。依圖則表現(xiàn)出對安防、醫(yī)療兩大領(lǐng)域的專注深耕,依托產(chǎn)品化、工程化能力深入落地。

按照中國信息通信研究院的統(tǒng)計結(jié)果,目前中國人工智能應(yīng)用市場主要由五個領(lǐng)域構(gòu)成,其中,由于近幾年中國互聯(lián)網(wǎng)娛樂、廣告?zhèn)鞑ズ凸舶踩曨l監(jiān)控市場的高速發(fā)展,計算機視覺市場規(guī)模以37%占比大幅領(lǐng)先。

而在機器視覺領(lǐng)域的細(xì)分市場構(gòu)成中,安防行業(yè)又以67.9%占據(jù)大部分份額,這得益于中國公共安全視頻監(jiān)控建設(shè)的龐大市場。根據(jù)《安防+AI人工智能白皮書》的預(yù)計,在2020年全球智能安防產(chǎn)業(yè)規(guī)模將實現(xiàn)106億美元,中國將達(dá)到20億美元。

人工智能行業(yè)是一個典型的技術(shù)驅(qū)動型行業(yè),技術(shù)的核心在于算力、算法和數(shù)據(jù)三個方面。GPU及AI專用芯片的出現(xiàn)突破了傳統(tǒng)CPU的算力瓶頸,數(shù)據(jù)運算速度和處理規(guī)模爆發(fā)性增長,從而為大數(shù)據(jù)的分析提供硬件上的支持。越來越多的應(yīng)用領(lǐng)域正持續(xù)積累著日趨豐富的大數(shù)據(jù),海量的圖像和視頻內(nèi)容為深度學(xué)習(xí)提供了有力的數(shù)據(jù)支撐。

視覺人工智能行業(yè)的快速發(fā)展一方面得益于現(xiàn)階段算力的大幅提升及算法的大幅改善(國內(nèi)算法甚至已經(jīng)達(dá)到國際水平),另一方面則受益于下游應(yīng)用市場的廣闊空間。機器學(xué)習(xí)、深度學(xué)習(xí)等算法能力的不斷增強促進(jìn)了視覺人工智能行業(yè)的高速發(fā)展。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論