由于大規(guī)模數(shù)據(jù)+大規(guī)模算力的基本方法論已經(jīng)成熟,人工智能行業(yè)的發(fā)展路徑漸明:各國(guó)政府、IT產(chǎn)業(yè)巨頭們紛紛加強(qiáng)布局,那些數(shù)據(jù)儲(chǔ)備充分、商業(yè)價(jià)值清晰的場(chǎng)景,人工智能更是發(fā)展迅猛,人工智能初創(chuàng)公司也在不斷涌現(xiàn),“AI+垂直行業(yè)”迎來(lái)變革。
華泰科捷是一家專注于公共安全領(lǐng)域人工智能視頻產(chǎn)品開(kāi)發(fā)與系統(tǒng)解決方案的國(guó)家級(jí)高新技術(shù)企業(yè)。去年,新三板上市公司北京華泰科捷信息技術(shù)股份有限公司(下稱華泰科捷)與清華大學(xué)電子工程系達(dá)成合作,攜手打造AI智能前端產(chǎn)品合作項(xiàng)目。如何將人工智能技術(shù)與行業(yè)應(yīng)用、場(chǎng)景驅(qū)動(dòng)有效結(jié)合,清華大學(xué)電子工程系王生進(jìn)教授、華泰科捷總裁兼首席執(zhí)行官傅劍輝先生有著重要發(fā)言權(quán)。
簽約儀式現(xiàn)場(chǎng)合影( 左起依次為劉從新先生、王生進(jìn)先生、傅劍輝先生)
信息化觀察網(wǎng):AI從2015年開(kāi)始就成了社會(huì)關(guān)注熱點(diǎn)及傳播熱詞,但AI在用戶生活領(lǐng)域里的應(yīng)用仍然處于比較淺的層次,甚至有些人認(rèn)為,現(xiàn)在的AI其實(shí)都是假AI,都是靠后臺(tái)數(shù)據(jù)人員對(duì)數(shù)據(jù)進(jìn)行處理,然后再“喂給”機(jī)器的,那么AI在全球領(lǐng)域的發(fā)展到底是一個(gè)怎樣的狀況?
傅劍輝:當(dāng)前人工智能的浪潮已席卷了全球,人工智能領(lǐng)域的公司也在不斷激增。覆蓋了深度學(xué)習(xí)/機(jī)器學(xué)習(xí)、自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)/圖像識(shí)別、手勢(shì)控制、智能機(jī)器人等13個(gè)細(xì)分行業(yè)。
在未來(lái)10年甚至更久的時(shí)間里,人工智能將是眾多智能產(chǎn)業(yè)技術(shù)和應(yīng)用發(fā)展的突破點(diǎn),吸引投資人的資金根據(jù)BBC預(yù)測(cè),到2020年全球人工智能市場(chǎng)規(guī)模為1190億人民幣,年復(fù)合增長(zhǎng)率19.7%。
從目前互聯(lián)網(wǎng)巨頭們發(fā)布的產(chǎn)品可以明確看出,如今的人工智能已經(jīng)到了從實(shí)驗(yàn)室走入真實(shí)的生產(chǎn)環(huán)境和日常生活的臨界點(diǎn),未來(lái)人類將進(jìn)入到一個(gè)人工智能無(wú)處不在的社會(huì)。
在技術(shù)變革的關(guān)鍵階段,許多廠商多年來(lái)的技術(shù)儲(chǔ)備可使其實(shí)現(xiàn)華麗轉(zhuǎn)身,在新的時(shí)革面前顯得從容不迫。華泰科捷便是其中代表性的一員。從成立之初,華泰科捷便是一家以傳統(tǒng)視頻為主體,實(shí)現(xiàn)其智能化的科技型企業(yè),勇于創(chuàng)新的企業(yè)文化讓他們?cè)缭鐝?015年便開(kāi)始著眼AI的部署。“早在2015年,華泰科捷就與美國(guó)硅谷團(tuán)隊(duì)合作,開(kāi)始介入人臉識(shí)別的應(yīng)用的開(kāi)發(fā),觸及人臉識(shí)別體系。”
雖然人工智能是未來(lái)行業(yè)的趨勢(shì)所在,但目前“安防+AI”才剛剛起步,廠商也必須清楚意識(shí)到兩點(diǎn):一是算法公司雖然處在風(fēng)口浪尖上,得到資本的熱捧,但實(shí)質(zhì)上在垂直行業(yè)里落地的速度仍然比較慢,導(dǎo)致算法的成本與第三方的合作費(fèi)用昂貴,整個(gè)行業(yè)處在剝離的狀態(tài);二是整個(gè)系統(tǒng)計(jì)算方式,基本采用云端的方案來(lái)做部署和計(jì)算。
圖像識(shí)別是人工智能的主戰(zhàn)場(chǎng)和主要應(yīng)用方向。在傳統(tǒng)安防系統(tǒng)中,攝像機(jī)采集的數(shù)據(jù)要經(jīng)過(guò)后臺(tái)對(duì)其進(jìn)行解碼、抽禎、人臉識(shí)別與結(jié)構(gòu)化應(yīng)用、再進(jìn)行特征碼的提取、后期比對(duì),整個(gè)過(guò)程系統(tǒng)把整個(gè)計(jì)算壓力,全部壓在了后臺(tái)。因此,如何實(shí)現(xiàn)前端在復(fù)雜環(huán)境下的智能處理和采集,成為需要跨越的一道屏障。
信息化觀察網(wǎng):剝?nèi)I華麗的外衣,有幾個(gè)有關(guān)AI的關(guān)鍵詞其實(shí)已經(jīng)深入人心,比如大數(shù)據(jù)、核心算法、深度學(xué)習(xí)等,那么這些有關(guān)AI的核心關(guān)鍵詞,到底都代表著什么含義,同時(shí)它們之間又是怎樣的邏輯關(guān)系,能勾畫出怎樣一幅畫面?
王生進(jìn):大數(shù)據(jù)是個(gè)新名詞,代表著一種新興的影響世界發(fā)展的資源,已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。我們都知道,一個(gè)程序的核心在于算法,可以說(shuō)人工智能的研究都是基于算法。而人工智能的目的就是讓計(jì)算機(jī)這臺(tái)機(jī)器能夠象人一樣思考,而深度學(xué)習(xí)是一種機(jī)器學(xué)習(xí)的方法,它試圖使用包含復(fù)雜結(jié)構(gòu)或由多重非線性變換構(gòu)成的多個(gè)處理層(神經(jīng)網(wǎng)絡(luò))對(duì)數(shù)據(jù)進(jìn)行高層抽象的算法。
2017年7月8日,國(guó)務(wù)院發(fā)布新一代人工智能發(fā)展規(guī)劃(國(guó)發(fā)〔2017〕35號(hào))。人工智能成為國(guó)際競(jìng)爭(zhēng)的新焦點(diǎn),是引領(lǐng)未來(lái)的戰(zhàn)略性技術(shù);人工智能成為經(jīng)濟(jì)發(fā)展的新引擎,作為新一輪產(chǎn)業(yè)變革的核心驅(qū)動(dòng)力;搶抓人工智能發(fā)展的重大戰(zhàn)略機(jī)遇,構(gòu)筑我國(guó)人工智能發(fā)展的先發(fā)優(yōu)勢(shì),加快建設(shè)創(chuàng)新型國(guó)家和世界科技強(qiáng)國(guó)。
如今,基于統(tǒng)計(jì)學(xué)習(xí)的人臉識(shí)別方法雖得到了廣泛應(yīng)用,但人臉識(shí)別技術(shù)的發(fā)展及應(yīng)用仍面臨諸多困難,當(dāng)前遇到的主要困難包括:
人臉面部結(jié)構(gòu)的相似性、人臉的姿態(tài)變化、人臉的表情變化、復(fù)雜環(huán)境的光照變化、人臉的飾物遮擋、人臉的年齡變化。
以上問(wèn)題給人臉識(shí)別帶來(lái)了相當(dāng)大的挑戰(zhàn)。隨著深度學(xué)習(xí)的發(fā)展,我們遇到的困難得到了解決。
大數(shù)據(jù)時(shí)代,如何處理從各個(gè)數(shù)據(jù)源收集來(lái)的信息,如何對(duì)不同地點(diǎn)、不同媒體、不同時(shí)間,以及不同清晰度、不同粒度的信息進(jìn)行綜合利用,包括對(duì)信息的真?zhèn)芜M(jìn)行鑒定,都是從未完成過(guò)的挑戰(zhàn)。顯性信息關(guān)聯(lián),主要體現(xiàn)在目標(biāo)表觀信息的關(guān)聯(lián)上,如目標(biāo)類型,目標(biāo)屬性,目標(biāo)狀態(tài),目標(biāo)時(shí)空點(diǎn);隱性信息關(guān)聯(lián),主要體現(xiàn)在邏輯關(guān)系信息的關(guān)聯(lián)上,如“蝴蝶效應(yīng)”,亞洲蝴蝶拍拍翅膀,將使美洲幾個(gè)月后出現(xiàn)龍卷風(fēng)。
人像態(tài)勢(shì)識(shí)別,全面構(gòu)建對(duì)人的像態(tài)、形態(tài)、神態(tài)、意態(tài)的深度識(shí)別。通過(guò)人像態(tài)視識(shí)別,實(shí)現(xiàn)對(duì)目標(biāo)人的整體信息分析、完善的狀態(tài)描述。像態(tài)、形態(tài),側(cè)重“格物”,本意即為考察人這個(gè)事物;神態(tài)、意態(tài),偏向“致知”,進(jìn)而達(dá)到完善的識(shí)別和理解;人像態(tài)視識(shí)別的目標(biāo)就是“格物致知”。
綜上,通過(guò)人像態(tài)視識(shí)別,實(shí)現(xiàn)對(duì)目標(biāo)人的整體信息分析、完善的狀態(tài)描述。人臉識(shí)別系統(tǒng)包含人臉識(shí)別、年齡估計(jì)、性別識(shí)別等,新一代的具有智能的安全監(jiān)控技術(shù),可實(shí)現(xiàn)對(duì)人臉的檢測(cè)、識(shí)別和分類;人像態(tài)視識(shí)別,全面構(gòu)建對(duì)人的像態(tài)、形態(tài)、神態(tài)、意態(tài)的深度識(shí)別。通過(guò)人像態(tài)視識(shí)別,實(shí)現(xiàn)對(duì)目標(biāo)人的整體信息分析、完善的狀態(tài)描述。
深度學(xué)習(xí)帶來(lái)了人臉識(shí)別技術(shù)所面臨困難的解決,關(guān)注人的像態(tài)、形態(tài)、神態(tài)、意態(tài)的人像態(tài)勢(shì)識(shí)別新概念的提出,又為技術(shù)發(fā)展提供了科學(xué)的理念支撐。
信息化觀察網(wǎng):AI的發(fā)展不能僅停留在技術(shù)突破以及機(jī)器人的圍棋對(duì)弈上,那么AI到目前為止到底在安防領(lǐng)域,是一個(gè)怎樣的發(fā)展?fàn)顩r?
傅劍輝:2011年至2016年中國(guó)安防市場(chǎng)連續(xù)5年保持2位數(shù)增長(zhǎng),結(jié)合國(guó)家政府對(duì)建設(shè)更高水平的平安中國(guó)、進(jìn)一步提升人民安全性的要求,未來(lái)中國(guó)的安防市場(chǎng)依然會(huì)保持穩(wěn)定增長(zhǎng),對(duì)人工智能、計(jì)算機(jī)視覺(jué)技術(shù)的升級(jí)改造也提出了更高的期待。
《中國(guó)安防行業(yè)“十三五” (2016-2020年)發(fā)展規(guī)劃》指出,伴隨從平安城市、智慧城市到雪亮工程等公共安全相關(guān)政策,以及人工智能相關(guān)國(guó)家戰(zhàn)略政策的逐步深化,智能安防也將與高清聯(lián)網(wǎng)一樣,將向規(guī)模化、全面高清化、智能化轉(zhuǎn)型升級(jí)。面對(duì)這廣闊的市場(chǎng),許多初創(chuàng)AI公司如商湯科技、曠視科技、云從科技等在完成融資后,紛紛把安防視為其商業(yè)模式落地的重要方向。雖然這些AI初創(chuàng)公司以核心技術(shù)和資本融資獲取先機(jī),但面對(duì)安防行業(yè)大體量公司的競(jìng)爭(zhēng)和擠壓,仍需要不斷拓展生物識(shí)別、計(jì)算機(jī)視覺(jué)、深度學(xué)習(xí)算法等技術(shù)類別。在市場(chǎng)進(jìn)入存量競(jìng)爭(zhēng)前,初創(chuàng)公司一方面要利用技術(shù)專利打造壁壘,向上下產(chǎn)業(yè)鏈延伸,另一方面需緊密貼合用戶需求,不斷優(yōu)化自身產(chǎn)品,提供軟硬件一體化解決方案和服務(wù),最終完成數(shù)據(jù)閉環(huán)從而提升自身競(jìng)爭(zhēng)力,達(dá)到產(chǎn)業(yè)生態(tài)平臺(tái)階段。
王生進(jìn):我認(rèn)為人工智能最好落地的領(lǐng)域就是安防,其原因有兩點(diǎn)。
一是安防需要人工智能。十一五期間,建設(shè)了許多視頻監(jiān)控工程,布置大量攝像頭,為公安破案起到了很好的作用。但所有視頻需要靠人工查看,這使得應(yīng)用效率非常低,不能實(shí)時(shí)發(fā)現(xiàn)關(guān)鍵信息。讓機(jī)器實(shí)時(shí)發(fā)現(xiàn)信息、自己判斷,這是安防的實(shí)際需求。
二是人工智能適合安防人工智能的一些主要技術(shù),例如圖像識(shí)別、語(yǔ)音識(shí)別在安防行業(yè)非常適合。安防行業(yè)的關(guān)鍵需求之一就是人臉識(shí)別,以及對(duì)于視頻的分析。目前人工智能的重要技術(shù)——深度學(xué)習(xí)技術(shù)讓人臉識(shí)別、語(yǔ)音識(shí)別技術(shù)有了很大的發(fā)展,與安防十分契合。
信息化觀察網(wǎng):據(jù)了解,目前AI+安防存在的核心問(wèn)題包含三點(diǎn):一是前端設(shè)備的單幀采集數(shù)量問(wèn)題;二是前端采集完成后,向中心服務(wù)器傳輸數(shù)據(jù)量太大的問(wèn)題;三是根據(jù)不同安防需求,核心算法的優(yōu)化問(wèn)題。那么華泰科捷希望在AI+安防領(lǐng)域獲得市場(chǎng)引領(lǐng)地位,針對(duì)性破解的是哪道難題?
傅劍輝:圖像識(shí)別是人工智能的主戰(zhàn)場(chǎng)和主要應(yīng)用方向。如何實(shí)現(xiàn)前端在復(fù)雜環(huán)境下的智能處理和采集,成為需要跨越的一道屏障。
基于此應(yīng)用需求,我們和清華大學(xué)王生進(jìn)教授團(tuán)隊(duì)歷經(jīng)半年的深入探討和認(rèn)真磋商,決定聯(lián)合開(kāi)發(fā)基于深度神經(jīng)網(wǎng)絡(luò)的嵌入式AI智能前端產(chǎn)品,實(shí)現(xiàn)在前端復(fù)雜環(huán)境下采集海量、精準(zhǔn)、高質(zhì)量的關(guān)注物體數(shù)據(jù)樣本,突破性提升后續(xù)算法模型的加速、算法性能提升及深度學(xué)習(xí)模型優(yōu)化。
在整個(gè)解決方案中,我們優(yōu)先考慮的是將人臉識(shí)別算法移植到攝像機(jī)的前端,完成復(fù)雜場(chǎng)景下高密度的動(dòng)態(tài)人臉檢測(cè)、人臉關(guān)鍵點(diǎn)定位、人臉切割以及人臉歸一化,形成實(shí)際有效的人臉照片。
看似簡(jiǎn)單的一步,其實(shí)已經(jīng)將人臉識(shí)別解決方案中的60%算力從后端轉(zhuǎn)移到了前端,極大地緩解了后端壓力的同時(shí),也讓前端能實(shí)現(xiàn)更實(shí)時(shí)的連接和服務(wù)。
王生進(jìn):關(guān)于人臉識(shí)別,我想補(bǔ)充一下。人臉識(shí)別技術(shù)在深度學(xué)習(xí)發(fā)展以后,性能得到了很大的提升,解決了一些傳統(tǒng)模式下不能解決的問(wèn)題。但人臉識(shí)別的實(shí)際應(yīng)用還是遇到了一些困難,主要體現(xiàn)在實(shí)際應(yīng)用中的復(fù)雜環(huán)境和算法上沒(méi)有克服的問(wèn)題。
光照、姿態(tài)、遮擋等條件因素都會(huì)對(duì)人臉識(shí)別產(chǎn)生影響,人工智能目前還無(wú)法對(duì)這些復(fù)雜的環(huán)境條件作出很好的判斷。
像大的表情變化、年齡的變化等實(shí)際可能發(fā)生的情況,目前識(shí)別算法還不能很好的解決。有些算法在單一情況下解決的很好,也就是說(shuō)受控環(huán)境下的人臉識(shí)別,已經(jīng)做的很好了。但實(shí)際的環(huán)境是眾多情況的混合,還需要努力研究。
在實(shí)際應(yīng)用中,往往會(huì)有很多我們考慮不到的環(huán)境因素,想讓機(jī)器完全駕馭任何情況下的人臉識(shí)別,需要從兩方面入手:更深入的研究算法,尋找更普適性的算法;理想情況下,如果我們考慮到所有場(chǎng)景,并讓人工智能學(xué)習(xí)、記錄這些場(chǎng)景,就可以解決復(fù)雜環(huán)境下的人臉識(shí)別問(wèn)題了。
信息化觀察網(wǎng):華泰科捷的主營(yíng)產(chǎn)品線,除了AI+安防領(lǐng)域的產(chǎn)品外,還有直播/錄播產(chǎn)品線,那么面對(duì)充滿無(wú)限想象力的AI領(lǐng)域,是否存在華泰科捷兩條產(chǎn)品線的結(jié)合可能性。
傅劍輝:華泰科捷的主營(yíng)產(chǎn)品除了AI+安防領(lǐng)域的產(chǎn)品外,還有面向教育和醫(yī)療領(lǐng)域的多媒體直播/錄播產(chǎn)品線,兩者在充滿無(wú)限想象力的AI技術(shù)催動(dòng)下,融合必然也會(huì)帶給人們更多的驚喜。華泰科捷立足于AI+多媒體錄播應(yīng)用市場(chǎng),將AI+智能算法賦予到了直播/錄播的系統(tǒng)當(dāng)中,這是我們?cè)诤笃卺槍?duì)多媒體錄播發(fā)展的規(guī)劃?;谌斯ぶ悄軐⑷讼駪B(tài)視分析,圖像采集和算法加載在平臺(tái)上,讓教育的課堂變得更加生動(dòng)形象,這些技術(shù)不管是對(duì)學(xué)校還是對(duì)學(xué)生,都是有實(shí)際幫助的意義。
結(jié)語(yǔ):AI行業(yè)規(guī)模不斷擴(kuò)大,新時(shí)期國(guó)家對(duì)人工智能發(fā)展高度重視,相關(guān)政策不斷出臺(tái),為人工智能發(fā)展保駕護(hù)航,并規(guī)范人工智能在各個(gè)領(lǐng)域的發(fā)展。AI初創(chuàng)企業(yè),結(jié)合國(guó)家政策緊跟市場(chǎng)發(fā)展,相信未來(lái)華泰科捷將開(kāi)發(fā)出更多AI智能前端產(chǎn)品,服務(wù)于AI+安防、AI+商業(yè)等應(yīng)用領(lǐng)域。