隨著人工神經(jīng)網(wǎng)絡(luò)研究在20世紀(jì)80年代后期的興起,人工智能進(jìn)入了一個(gè)新的階段。人工智能技術(shù)是如何推動(dòng)監(jiān)控領(lǐng)域的發(fā)展?
在近年來,深度學(xué)習(xí)在人工神經(jīng)獲得很多的突破,讓機(jī)器輔助人類工作,開拓人工智能的應(yīng)用領(lǐng)域,如安全領(lǐng)域的應(yīng)用,逐漸成為幫助人們生活的重要助手。
視頻監(jiān)控一直是安全系統(tǒng)的重要組成部分。 傳統(tǒng)的監(jiān)控系統(tǒng)包括前端攝像頭,傳輸電纜和視頻監(jiān)控平臺(tái)。 但是,觀看視頻不僅工作量巨大,而且人員效率也很低。 很長一段時(shí)間,安全領(lǐng)域正在尋找不同的解決方案。 人類監(jiān)控和監(jiān)控視頻的能力限制了他們對(duì)人工智能的需求。
傳統(tǒng)的自動(dòng)控制是基于確定的模型,智能控制的研究對(duì)象具有嚴(yán)重的模型不確定性,即模型未知或知之甚少的模型的結(jié)構(gòu)和參數(shù)在很大范圍內(nèi)變化。 例如,工業(yè)過程的不適定的結(jié)構(gòu)問題和一些干擾的不可預(yù)測(cè)性使得不可能建立他們的模型,這是基于模型的傳統(tǒng)自動(dòng)控制難以解決的。
智能監(jiān)控旨在通過視覺模式識(shí)別技術(shù)(如檢測(cè),識(shí)別和跟蹤)智能地分析和判斷監(jiān)控視頻中的對(duì)象,行為和事件等對(duì)象,從而減少或取代人為干預(yù)。 涵蓋的技術(shù)包括面對(duì)面。 視覺識(shí)別識(shí)別和行為分析,如行人,車輛,標(biāo)志等,主要分為以下幾類:
1、人臉識(shí)別。 人臉識(shí)別系統(tǒng)具有許多潛在價(jià)值。 它可以與視頻監(jiān)控系統(tǒng)結(jié)合使用,幫助執(zhí)法人員識(shí)別和識(shí)別人群中目標(biāo)人群的面孔。 這可能有助于警方在未來追蹤罪犯,甚至阻止他們發(fā)生。 從源頭組織犯罪。 可用于面部驗(yàn)證,安全面部搜索等。
2、車牌識(shí)別。 首先,停止車輛的車牌圖像,然后使用圖像檢測(cè)方法檢測(cè)車牌在圖像中的位置,然后提取并識(shí)別車牌文本,并檢測(cè)車輛的視頻流。 收集車道中的車輛以實(shí)現(xiàn)相同的車牌。 多次識(shí)別,最終輸出經(jīng)過優(yōu)化和選擇。 一般來說,它不需要外部觸發(fā)信號(hào),適應(yīng)性強(qiáng),對(duì)車輛遮擋有一定的抵抗力。 它主要用于社區(qū)車輛的登記和查詢,以及高速公路上非法車輛的捕獲。
3、語音識(shí)別。語音識(shí)別根據(jù)說話者的要求分為特定人語音識(shí)別和非特定人語音識(shí)別。 特定人物語音識(shí)別意味著當(dāng)前語音識(shí)別系統(tǒng)被設(shè)計(jì)為識(shí)別特定用戶的語音。 在這種情況下,數(shù)據(jù)庫中的音頻樣本全部來自用戶,因此數(shù)據(jù)庫中語言的語音習(xí)慣和語速。 語音與用戶一致,可以大大提高識(shí)別準(zhǔn)確率。 非特定人員語音識(shí)別是指使用通用系統(tǒng)供所有用戶使用,使用低門檻,主要實(shí)現(xiàn)人機(jī)交互。
視頻監(jiān)控應(yīng)用了人工智能技術(shù),雖然增強(qiáng)監(jiān)控存在一些潛在的風(fēng)險(xiǎn),但潛在的優(yōu)勢(shì)顯然大于缺點(diǎn)。 如今,算法和芯片領(lǐng)域的人工智能的成熟和成本使智能監(jiān)控的商業(yè)化更加流行。