AI視頻成為物聯(lián)網(wǎng)前端感知的重要手段

人是通過觸覺、聽覺、嗅覺、味覺、視覺來感知世界,其中視覺是人最重要有效的信息獲取方式。智能攝像機(jī)作為一個(gè)高級的物聯(lián)網(wǎng)終端,會成為萬物互聯(lián)智能世界的“眼睛”,成為高價(jià)值的信息獲取方式,給產(chǎn)業(yè)物聯(lián)網(wǎng)提供輸入,進(jìn)而推動(dòng)產(chǎn)業(yè)產(chǎn)生更大價(jià)值。

物聯(lián)網(wǎng)與計(jì)算機(jī)、互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)被稱為先后出現(xiàn)的4次信息產(chǎn)業(yè)浪潮。物聯(lián)網(wǎng)(The Internet of Things,簡稱IOT)是指通過各種信息傳感器、射頻識別技術(shù)、全球定位系統(tǒng)、紅外感應(yīng)器、激光掃描器等各種裝置與技術(shù),實(shí)時(shí)采集任何需要監(jiān)控、連接、互動(dòng)的物體或過程,采集其聲、光、熱、電、力學(xué)、化學(xué)、生物、位置等各種需要的信息,通過各類可能的網(wǎng)絡(luò)接入,實(shí)現(xiàn)物與物、物與人的泛在連接,實(shí)現(xiàn)對物品和過程的智能化感知、識別和管理。它具有普通對象設(shè)備化、自治終端互聯(lián)化和普適服務(wù)智能化3個(gè)重要特征。

物聯(lián)網(wǎng)可追溯最早的鼻祖要算1990年由施樂公司發(fā)售的網(wǎng)絡(luò)可樂販賣機(jī)——NetworkingCoke Machine。這是一臺可以監(jiān)測出機(jī)器內(nèi)可樂是否有貨,溫度是否夠冰涼,并且能夠聯(lián)網(wǎng)的販賣機(jī)。

1999年在美國召開的移動(dòng)計(jì)算和網(wǎng)絡(luò)國際會議上,麻省理工大學(xué)的凱文·阿什頓教授提出基于互聯(lián)網(wǎng)、RFID技術(shù)、EPC標(biāo)準(zhǔn)在計(jì)算機(jī)互聯(lián)網(wǎng)的基礎(chǔ)上,利用射頻識別技術(shù)、無線數(shù)據(jù)通信技術(shù)等,構(gòu)造出一個(gè)實(shí)現(xiàn)全球物品信息實(shí)時(shí)共享的實(shí)物互聯(lián)網(wǎng)(Internetof Things)的方案,這是物聯(lián)網(wǎng)概念首次被正式提出來。

在2005年國際電信聯(lián)盟發(fā)布的互聯(lián)網(wǎng)研究報(bào)告《物聯(lián)網(wǎng)》。報(bào)告描述了世界上的萬事萬物,只要嵌入一個(gè)微型的傳感器芯片,通過互聯(lián)網(wǎng)就能夠?qū)崿F(xiàn)物與物的信息交互,從而形成一個(gè)無所不在的“物聯(lián)網(wǎng)”。

物聯(lián)網(wǎng)技術(shù)分為四個(gè)層次:感知技術(shù)、傳輸技術(shù)、支撐技術(shù)、應(yīng)用技術(shù)。物聯(lián)網(wǎng)結(jié)構(gòu)層次分為三層,自下向上依次是感知層、網(wǎng)絡(luò)層、應(yīng)用層。感知層是信息采集的關(guān)鍵部分,是物聯(lián)網(wǎng)的核心,是物物相連的基礎(chǔ),其主要功能是識別物體,采集信息。

物聯(lián)網(wǎng)感知層的主要技術(shù)有:RFID技術(shù)、二維碼技術(shù)、智能視頻技術(shù)、衛(wèi)星導(dǎo)航技術(shù)、Zig-Bee技術(shù)和藍(lán)牙技術(shù)等。感知層由基本的感應(yīng)器件以及感應(yīng)器組成的網(wǎng)絡(luò)兩部分組成。感知層主要設(shè)備包括二維碼標(biāo)簽和識讀器、RFID標(biāo)簽和讀寫器、攝像頭、全球衛(wèi)星定位系統(tǒng)、多種傳感器、M2M終端、智能手機(jī)、傳感器網(wǎng)關(guān)等,前端的感知設(shè)備主要功能與人體結(jié)構(gòu)中五官和皮膚的作用類似。

上述感知層的主要技術(shù)與設(shè)備各有其優(yōu)勢與不足,我們先做一個(gè)簡單的比較。

M2M(Machine to Machine)指的是將數(shù)據(jù)從一臺終端傳送到另一臺終端,比如紅外發(fā)射與接收器,上班用的門禁卡與讀卡器,超市的條碼與掃描儀,再比如日前比較流行的NFC手機(jī)支付。它包括了多種不同的感應(yīng)方式。

多種傳感器指的是采集聲、光、熱、電、力學(xué)、化學(xué)、生物、位置等各種需要信息的傳感器,通常一種傳感器只能采集1-2種信息,無法獲得物物相連的所有信息。

傳感器網(wǎng)關(guān)是感知層的的通信設(shè)備,通常它無法采集信息。

ZigBee定位技術(shù)、超寬帶室內(nèi)定位(UWB)技術(shù)、藍(lán)牙定位技術(shù)、Wi-Fi定位技術(shù)與超聲波定位技術(shù)都具備定位功能,多數(shù)易于聯(lián)網(wǎng),但是它們發(fā)送的距離較小,其使用范圍有限。

智能手機(jī)具備識別定位與通信功能,其發(fā)送的信息多數(shù)情況下可以代表某一人物個(gè)體,但由于隱私權(quán)受保護(hù),對其使用受到限制。

二維碼是用特定的幾何圖形按一定規(guī)律在平面分布的黑白相間的矩形方陣記錄數(shù)據(jù)符號信息的新一代條碼技術(shù),由一個(gè)二維碼矩陣圖形和一個(gè)二維碼號,以及下方的說明文字組成,通過圖像輸入設(shè)備或光電掃描設(shè)備自動(dòng)識讀以實(shí)現(xiàn)信息自動(dòng)處理,二維碼的識別應(yīng)用具有成本低、信息量較大,識讀速度快,全方位識讀等特點(diǎn),但也存在掃碼距離不能太大,不能雙向交換信息,標(biāo)簽易于被替換、自動(dòng)識別較為困難的不足。

用戶可以用全球衛(wèi)星定位系統(tǒng)在全球范圍內(nèi)實(shí)現(xiàn)全天候、連續(xù)、實(shí)時(shí)的三維導(dǎo)航定位和測速。其特點(diǎn)是不需要sim卡,不需要連接網(wǎng)絡(luò),只要在戶外,基本上隨時(shí)隨地都可以準(zhǔn)確定位。但是終端設(shè)備啟動(dòng)后搜索衛(wèi)星的時(shí)間一般需要2分鐘左右。另一個(gè)缺點(diǎn)是信號不能透過金屬和鋼筋水泥混合物,因而不能在室內(nèi)如地下停車場、高橋下、密集的樓房下使用。

射頻識別(RFID)技術(shù)利用射頻方式,利用天線把無線電信號調(diào)成電磁場,附著于物品的標(biāo)簽經(jīng)過磁場后生成感應(yīng)電流把數(shù)據(jù)傳送出去,以多對雙向通信交換數(shù)據(jù)以達(dá)到識別和三角定位的目的。對于目前應(yīng)用較多的RFID網(wǎng)絡(luò)來說,附著在設(shè)備上的RFID標(biāo)簽和用來識別RFID信息的讀寫器都屬于物聯(lián)網(wǎng)的感知層。由于射頻識別技術(shù)和設(shè)備具有非接觸、自動(dòng)化程度高、耐用可靠、識別速度快、適應(yīng)多種工作環(huán)境、可以實(shí)現(xiàn)高速和多標(biāo)簽同時(shí)識別的優(yōu)勢,因此在物聯(lián)網(wǎng)感應(yīng)層中得到廣泛應(yīng)用。射頻識別定位技術(shù)作用距離較小,但它可以在幾毫秒內(nèi)得到厘米級定位精度的信息,而且標(biāo)識的體積比較小,造價(jià)比較低。但其不具有通信能力,抗干擾能力較差,不便于整合到其他系統(tǒng)之中,且用戶的安全隱私保障和國際標(biāo)準(zhǔn)化都不夠完善。射頻識別技術(shù)與設(shè)備已經(jīng)被收費(fèi)站、倉庫、工廠、商場廣泛使用在車輛收費(fèi)和貨物、商品流轉(zhuǎn)定位上,是目前使用最多的技術(shù)與設(shè)備。

攝像頭是一種光學(xué)信息傳感器,具有視頻攝像/傳播和靜態(tài)圖像捕捉等基本功能,它是借由鏡頭采集圖像后,由攝像頭內(nèi)的感光組件電路及控制組件對圖像進(jìn)行處理并轉(zhuǎn)換成電腦所能識別的數(shù)字信號,然后借由并行端口或USB連接輸入到電腦后由軟件再進(jìn)行圖像還原。傳統(tǒng)的攝像頭能夠自動(dòng)獲得的信息量較少,通過系統(tǒng)平臺的視頻分析功能可以識別車牌數(shù)字。

人是通過觸覺、聽覺、嗅覺、味覺、視覺來感知世界,其中視覺是人最重要有效的信息獲取方式。智能攝像機(jī)作為一個(gè)高級的物聯(lián)網(wǎng)終端,會成為萬物互聯(lián)智能世界的“眼睛”,成為高價(jià)值的信息獲取方式,給產(chǎn)業(yè)物聯(lián)網(wǎng)提供輸入,進(jìn)而推動(dòng)產(chǎn)業(yè)產(chǎn)生更大價(jià)值。

2010年中科院自動(dòng)化研究所生物識別與安全技術(shù)研究中心李子青教授提出“智能視覺物聯(lián)網(wǎng)”的概念。視覺物聯(lián)網(wǎng)涉及物聯(lián)網(wǎng)的視覺感知部分,利用各類圖像獲取傳感器,包括監(jiān)控?cái)z像機(jī)、手機(jī)、數(shù)碼相機(jī),獲取人、車、物圖像或視頻視覺數(shù)據(jù),提取視覺標(biāo)簽并采用智能分析技術(shù)對視覺信息進(jìn)行處理,提取視覺標(biāo)簽,為后續(xù)利用提供支撐。2010年7月,《智能視覺物聯(lián)網(wǎng)》的創(chuàng)意在“2010中國物聯(lián)網(wǎng)創(chuàng)意和應(yīng)用設(shè)計(jì)大賽”中獲獎(jiǎng)。

智能視覺物聯(lián)網(wǎng)的定義是:通過視覺傳感標(biāo)簽、射頻識別(RFID)、紅外感應(yīng)器、全球定位系統(tǒng)、激光掃描器等信息傳感設(shè)備,按約定的協(xié)議,把任何物體與互聯(lián)網(wǎng)相連接,進(jìn)行信息交換和通信,以實(shí)現(xiàn)對物體的智能化識別、定位、跟蹤、監(jiān)控和管理的一種網(wǎng)絡(luò)。通過公共場所管理、智能樓宇、交通管制、學(xué)校、監(jiān)獄、金融、社區(qū)、個(gè)人視頻設(shè)備等終端用戶搭建起“智能視覺物聯(lián)網(wǎng)”,能夠?qū)崿F(xiàn)對資源的統(tǒng)一監(jiān)控、管理和調(diào)度,因此智能視覺物聯(lián)網(wǎng)具有廣泛的應(yīng)用前景。

智能視覺標(biāo)簽系統(tǒng) - 作為智能視覺物聯(lián)網(wǎng)信息處理的核心部分,對視覺感知范圍的人、車或其他物件、對目標(biāo)標(biāo)簽物體的身份及其實(shí)時(shí)狀態(tài)進(jìn)行智能分析,對其進(jìn)行“貼標(biāo)簽”處理,并輔以標(biāo)簽屬性包括名稱、ID、屬性、地點(diǎn)、運(yùn)動(dòng)狀態(tài)、行為等(見下圖)。與RFID物理標(biāo)簽相比,智能視覺標(biāo)簽系統(tǒng)的特點(diǎn)是:(a)通過無源方式提供標(biāo)簽信息,(b)屬于虛擬表現(xiàn)性質(zhì),(c)打破距離限制,可以遠(yuǎn)距離獲取。

深度學(xué)習(xí)與人工智能(AI)技術(shù)的進(jìn)步,使得具備人工智能的攝像機(jī)能夠從其拍攝的視頻中獲得更多的有用信息和數(shù)據(jù)。隨著人工智能賦能攝像機(jī),視頻監(jiān)控智能分析開始“前移”,尤其是AI技術(shù)的成熟應(yīng)用,開啟了監(jiān)控?cái)z像機(jī)發(fā)展的新紀(jì)元,加速了智能感知前端的普及應(yīng)用。AI視頻成為物聯(lián)網(wǎng)前端感知的重要手段。

中星技術(shù)股份有限公司推出的“算法定義”系列智慧型攝像機(jī)內(nèi)置深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)架構(gòu),可根據(jù)應(yīng)用需要快速更替智能分析算法和參數(shù),滿足人員和車輛布控、目標(biāo)分類和抓拍、事件發(fā)現(xiàn)和監(jiān)控環(huán)境自適應(yīng)等差異化場景的應(yīng)用需要。

??低曆邪l(fā)的“合智能系列攝像機(jī)”聚合了多種專為復(fù)雜場景設(shè)計(jì)的深度學(xué)習(xí)算法,實(shí)現(xiàn)全結(jié)構(gòu)化數(shù)據(jù)精準(zhǔn)采集,具備多場景數(shù)據(jù)融合分析能力,實(shí)現(xiàn)全方位態(tài)勢感知。該系列攝像機(jī)具備多目標(biāo)并發(fā)全結(jié)構(gòu)化數(shù)據(jù)采集能力,基于原始視頻,利用多引擎動(dòng)態(tài)檢測跟蹤技術(shù),實(shí)現(xiàn)最優(yōu)目標(biāo)屬性信息提取,消除低質(zhì)量數(shù)據(jù)干擾,更有利于云中心數(shù)據(jù)利用。與此同時(shí),“合智能”系列攝像機(jī)基于多鏡頭設(shè)計(jì)架構(gòu),突破傳統(tǒng)場景邊界,融合全景視角和細(xì)節(jié)特寫數(shù)據(jù),實(shí)現(xiàn)城市管理、行為分析、道路事件等全方位深度態(tài)勢感知。該產(chǎn)品榮獲2019世界物聯(lián)網(wǎng)博覽會新產(chǎn)品創(chuàng)新獎(jiǎng)。

人的五種主要感知,視覺、聽覺、嗅覺、味覺、觸覺中信息量最大的就是視覺。隨著攝像頭的AI化,以及逐步普及與聯(lián)網(wǎng),視頻數(shù)據(jù)在物聯(lián)網(wǎng)發(fā)展中將發(fā)揮巨大的作用。這也大大擴(kuò)展了視頻產(chǎn)業(yè)的市場空間。2018年,國內(nèi)物聯(lián)網(wǎng)產(chǎn)業(yè)規(guī)模就已突破1.2萬億人民幣。其市場規(guī)模和發(fā)展速度會比視頻監(jiān)控行業(yè)更大更高。

THEEND