1、人工智能加快發(fā)展,推動數(shù)據(jù)標(biāo)注產(chǎn)業(yè)發(fā)展
數(shù)據(jù)標(biāo)注是人工智能產(chǎn)業(yè)的基礎(chǔ),是機器感知現(xiàn)實世界的起點,全球數(shù)據(jù)標(biāo)注行業(yè)的發(fā)展伴隨著全球人工智能行業(yè)發(fā)展起來。
上世紀(jì)90年代,深藍戰(zhàn)勝國際象桃世界冠軍卡新帕羅夫,全球人工智能發(fā)展進入全新探索期,一些科技公司如Appen等開始關(guān)注并布局數(shù)據(jù)服務(wù)行業(yè);
2007年,斯坦福大學(xué)教授李飛飛等人開始啟動ImageNet項目,該項目主要借助亞馬遜的勞務(wù)眾包平臺Mechanical Turk(AMT)來完成圖片的分類和標(biāo)注,以便為機器學(xué)習(xí)算法提供更好的數(shù)據(jù)集,自此數(shù)據(jù)標(biāo)注行業(yè)正式拉開序幕。
2007年開始,全球人工智能和大數(shù)據(jù)行業(yè)的快速發(fā)展催生數(shù)據(jù)處理需求快速增長,全球開始涌現(xiàn)出一批數(shù)據(jù)標(biāo)注公司,全球數(shù)據(jù)標(biāo)注行業(yè)也進入成長期。
2015年以來,全球自動駕駛、智慧醫(yī)療、智慧教育等人工智能應(yīng)用領(lǐng)域加快發(fā)展,全球數(shù)據(jù)標(biāo)注行業(yè)也進入快速發(fā)展期,一些優(yōu)質(zhì)的數(shù)據(jù)標(biāo)注公司加快并購步伐,同時也有越來越多的新興公司加入數(shù)據(jù)標(biāo)注行業(yè)。
2、北美、歐洲、亞太地區(qū)企業(yè)供給數(shù)量較多
目前,全球數(shù)據(jù)標(biāo)注行業(yè)企業(yè)數(shù)量眾多,但具有一定規(guī)模的企業(yè)數(shù)量相對較少,主要分布在北美、歐洲、印度、中國,其中印度和中國的數(shù)據(jù)標(biāo)注,其次為中國和印度地區(qū),全球數(shù)據(jù)標(biāo)注行業(yè)供給情況如下:
3、全球數(shù)據(jù)量呈指數(shù)式增長,非結(jié)構(gòu)化數(shù)據(jù)的應(yīng)用依賴于清洗標(biāo)注
PC、互聯(lián)網(wǎng)、消費級移動設(shè)備的興起宣告了數(shù)據(jù)時代的來臨,物聯(lián)網(wǎng)的發(fā)展更使線下業(yè)務(wù)產(chǎn)生的大量數(shù)據(jù)被采集起來,全球數(shù)據(jù)產(chǎn)生量迅猛增長,為人工智能的發(fā)展提供了大量的訓(xùn)練素材,推動了數(shù)據(jù)標(biāo)注行業(yè)的發(fā)展。
當(dāng)前,全球數(shù)據(jù)量仍在飛速增長的階段。根據(jù)國際權(quán)威機構(gòu)Statista的統(tǒng)計和預(yù)測,2020年全球數(shù)據(jù)產(chǎn)生量估計達到47ZB。
目前市場上有1%的數(shù)據(jù)能被收集保存下來,同時其中有90%數(shù)據(jù)是非結(jié)構(gòu)化的數(shù)據(jù),這些非結(jié)構(gòu)化的數(shù)據(jù)只有經(jīng)過清洗與標(biāo)注才能被喚醒價值,這就產(chǎn)生了源源不斷的清洗與標(biāo)注需求,按照90%的非結(jié)構(gòu)化數(shù)據(jù)全部需要被清洗標(biāo)注以應(yīng)用于人工智能發(fā)展來看,2020年全球需要被標(biāo)注的數(shù)據(jù)量達433EB。
4、2020年市場規(guī)模達到13.1億美元,市場保持較快增速
根據(jù)Grand View Research公布的數(shù)據(jù)顯示,在全球人工智能快速發(fā)展的推動下,全球數(shù)據(jù)標(biāo)注行業(yè)市場規(guī)??焖僭鲩L,2020年全球數(shù)據(jù)標(biāo)注市場規(guī)模為13.1億美元,2016-2020年年均復(fù)合增速達17.8%。