人工智能背后的人工

中國(guó)科學(xué)報(bào)
佚名
人工智能的發(fā)展如火如荼。其背后必不可少的要素之一便是供機(jī)器學(xué)習(xí)的大數(shù)據(jù)采集工作,如今依然出自人工之手。在中國(guó)西部異軍突起的貴州省的深山之中,就有一群大數(shù)據(jù)采集者,他們是“人工智能背后的人工”...

人工智能的發(fā)展如火如荼。其背后必不可少的要素之一便是供機(jī)器學(xué)習(xí)的大數(shù)據(jù)采集工作,如今依然出自人工之手。在中國(guó)西部異軍突起的貴州省的深山之中,就有一群大數(shù)據(jù)采集者,他們是“人工智能背后的人工”。

沿著貴陽市區(qū)剛修好的公路駕車50多公里,就到了百鳥河數(shù)字小鎮(zhèn)。小鎮(zhèn)上一個(gè)容納400多人的數(shù)據(jù)工場(chǎng),電腦前坐滿了來自附近一家扶貧高職的學(xué)生,他們來自各個(gè)專業(yè),來這里主要進(jìn)行數(shù)據(jù)標(biāo)注的實(shí)習(xí)。把人工智能需要識(shí)別的數(shù)據(jù),通過分類、畫框等方式標(biāo)注出來。標(biāo)注好的數(shù)據(jù)將用于“人臉識(shí)別、無人駕駛、語音識(shí)別”等高科技項(xiàng)目。譬如,把道路上的汽車、行人、紅綠燈等框起來,用于自動(dòng)駕駛訓(xùn)練等。

數(shù)據(jù)標(biāo)注部接到新項(xiàng)目,采集不同場(chǎng)景下的三十二套動(dòng)作,學(xué)生們按照?qǐng)D紙中指定姿勢(shì)拍下照片。數(shù)據(jù)標(biāo)注是勞動(dòng)密集型行業(yè),門檻不高,經(jīng)過幾天培訓(xùn)就能上手。每天上班七八個(gè)小時(shí),一個(gè)月掙2000元。這些學(xué)生的家鄉(xiāng)屬于貧困幫扶地區(qū),網(wǎng)絡(luò)閉塞,4G網(wǎng)絡(luò)信號(hào)還沒延伸到這里,村里沒幾戶人家能上網(wǎng),更別提人工智能和大數(shù)據(jù)了。

今年3月26日,一家互聯(lián)網(wǎng)公司在北京發(fā)布了首款人工智能視頻音箱。音箱的語音識(shí)別大數(shù)據(jù),正是出自于這些標(biāo)注員。隨著人工智能產(chǎn)業(yè)的飛速發(fā)展,需要的數(shù)據(jù)量也在持續(xù)增加,貴州的這家數(shù)據(jù)工場(chǎng),已經(jīng)不能夠滿足甲方的要求。緊鄰工場(chǎng),又租下了一幢三層的樓,等待裝修好繼續(xù)擴(kuò)招標(biāo)注員工。

這令人想起卓別林的《摩登時(shí)代》。100多年過去了,就這些學(xué)生而言,人機(jī)關(guān)系依舊。區(qū)別在于,在流水線上,卓別林做的是單調(diào)重復(fù)的體力勞動(dòng),人是機(jī)器;在數(shù)字小鎮(zhèn),學(xué)生們做的事同樣單調(diào)重復(fù),只不過是腦力勞動(dòng),人是“數(shù)字機(jī)器”。

小純就是其中一位標(biāo)注員,他對(duì)未來前途感到迷茫,“即使數(shù)據(jù)標(biāo)得再好,還是沒有前途”。

或許,“數(shù)字機(jī)器”只能偶爾顯示生命的鮮活。

傍晚下班,小純?cè)诼放钥匆娨淮鼗ㄩ_了,趕緊拿起手機(jī)過去拍,“花開很美,可惜白天沒有時(shí)間去看它最美的樣子”。

這是人工智能產(chǎn)業(yè)鏈的一部分,“供給側(cè)”。眼下,貧困山區(qū)中坐在電腦前框圖的高職學(xué)生,這些年輕人也是“人機(jī)回圈”中的一部分。人機(jī)回圈的另一部分是“需求側(cè)”,是一線大城市的自動(dòng)駕駛研發(fā)和語音識(shí)別、圖像識(shí)別等其他人工智能。

小純和同學(xué)們正在源源不斷地為北上廣深的人工智能公司提供數(shù)據(jù)。他們想象不到,在人工智能“需求側(cè)”一側(cè)的模樣。學(xué)生對(duì)被自己框住的汽車一概不了解,時(shí)常會(huì)好奇,標(biāo)注里的SUV長(zhǎng)什么樣,無人駕駛是不是真的安全,還要不要考駕照等等。

在人機(jī)回圈中的兩部分人,供給側(cè)和需求側(cè)之間存在著被忽視的“數(shù)據(jù)折疊”。

在數(shù)字小鎮(zhèn),小純和同事們正在“以人工喂養(yǎng)人工智能”。卓別林“喂養(yǎng)”的是沒有生命不會(huì)長(zhǎng)大的機(jī)器。人工智能不一樣,在“喂養(yǎng)”中一步步長(zhǎng)大,最終可以輕而易舉地把需求側(cè)擴(kuò)展到數(shù)字小鎮(zhèn)。

在熱潮背后,小純和他的同學(xué)也在擔(dān)心著,他們教會(huì)了機(jī)器人學(xué)習(xí)工作,而未來的機(jī)器人會(huì)不會(huì)取代他們。

現(xiàn)在看來,他們的擔(dān)心多半多余。在中國(guó),只要存在這樣廉價(jià)的數(shù)字工人,人工智能產(chǎn)業(yè)鏈的需求側(cè)就不會(huì)主動(dòng)延伸和覆蓋到這樣的供給側(cè)。在以大數(shù)據(jù)著稱的貴州省,脫困脫貧有待時(shí)日,成為人工智能產(chǎn)業(yè)鏈供給側(cè)的一個(gè)環(huán)節(jié)來喂養(yǎng)人工智能,或?qū)⑹且欢螘r(shí)期的客觀事實(shí)。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論