人工智能曾經(jīng)過兩次繁榮,現(xiàn)在是它的第三次繁榮,主要原因有:一是以深度學(xué)習(xí)技術(shù)為代表的技術(shù)的迅速發(fā)展,尤其是在圖象領(lǐng)域取得了重大的突破;二是有強(qiáng)大的計(jì)算能力;三是數(shù)據(jù)越來越多。正因?yàn)橛辛藬?shù)據(jù)計(jì)算能力和算法,可以在更多的方面解決更多商業(yè)問題。當(dāng)今在視覺智能實(shí)踐的探索體現(xiàn)在如下四個(gè)方面。
1、電商搜索
目前電商搜索是一個(gè)比較成熟的產(chǎn)品,現(xiàn)在已經(jīng)開始大規(guī)模的部署。目標(biāo)是希望在電商搜索上,提供除了文字的另外一種搜索,如探索視頻廣告和視覺診斷。因?yàn)橛猩疃葘W(xué)習(xí)快速的發(fā)展,電商環(huán)境下的圖象搜索已經(jīng)取得了重大的突破,幾乎實(shí)現(xiàn)了所見即所得的效果,網(wǎng)上已經(jīng)能夠搜到相關(guān)的資料。
2、城市之眼
城市之眼的目標(biāo)是希望對(duì)城市里面大量攝像頭的分析,為我們的交通、安全提供更好的智能決策。從計(jì)算上來說,對(duì)整個(gè)城市上萬個(gè)攝像頭進(jìn)行分析,計(jì)算量非常大。但由于有當(dāng)今云、大批量計(jì)算平臺(tái)的支持,通過對(duì)視頻數(shù)據(jù)結(jié)構(gòu)化,可以實(shí)現(xiàn)對(duì)全網(wǎng)視頻數(shù)據(jù)大范圍搜索。如通過車輛的屬性和車牌,在視頻數(shù)據(jù)中進(jìn)行搜索,可以追查肇事車輛的逃逸。
3、視頻廣告
第一個(gè)方面的探索就是希望能夠在視頻中找到一個(gè)合適的位置,把廣告無縫嵌入進(jìn)去,并且不影響大家的觀看體驗(yàn)。
第二個(gè)方面希望通過對(duì)視頻內(nèi)容的分析,嵌入合適的符合這個(gè)場景的廣告。
第三個(gè)方面是智能廣告設(shè)計(jì),通過機(jī)器學(xué)習(xí)的手段使得廣告海報(bào)的生成更加便捷。用戶能夠通過簡單的畫直線和方框,生成一幅跟人工幾乎可以相媲美的廣告海報(bào)。
4.視覺診斷
視覺診斷包含兩個(gè)部分,一個(gè)是診斷機(jī)器,一個(gè)診斷生物。
傳統(tǒng)的工業(yè)診斷方法是人拿工具到現(xiàn)場檢查,診斷機(jī)器的目標(biāo)是通過視覺分析的手段能夠代替人工對(duì)機(jī)器的檢查。通過現(xiàn)場拍攝錄像,通過視覺分析的手段,能夠自動(dòng)的診斷出機(jī)器的故障;診斷生物則是醫(yī)學(xué)影象智能診斷。