科學(xué)家稱偏見(jiàn)是人類現(xiàn)有文化的延伸 |
學(xué)習(xí)人類寫(xiě)作的計(jì)算機(jī)能自動(dòng)區(qū)分一些職業(yè)詞匯的男女性別。圖片來(lái)源:Benedetto Cristofani
人工智能(AI)的一個(gè)最大前景是沒(méi)有瑣碎人類偏見(jiàn)的世界。其想法是利用運(yùn)算法則給男性和女性平等的工作機(jī)會(huì),用大數(shù)據(jù)預(yù)測(cè)犯罪行為從而回避政治監(jiān)管中的種族偏見(jiàn)。但一項(xiàng)新研究表明,計(jì)算機(jī)也會(huì)產(chǎn)生偏見(jiàn)。特別是當(dāng)它們向人類學(xué)習(xí)時(shí),當(dāng)算式“狼吞虎咽”地收集大量人類書(shū)寫(xiě)的文本詞義時(shí),它們也采用了非常類似人類的思維模式。
“別想著AI是什么公正的圣母?!庇?guó)巴斯大學(xué)和美國(guó)普林斯頓大學(xué)研究共同作者 Joanna Bryson說(shuō),“AI已經(jīng)成為我們現(xiàn)有文化的延伸。”
這一工作受到一種叫作內(nèi)隱聯(lián)想測(cè)試(IAT)的心理工具的啟發(fā)。在IAT中,詞匯會(huì)在計(jì)算機(jī)屏幕上閃過(guò),人們對(duì)它們做出的反應(yīng)表明潛意識(shí)的關(guān)聯(lián)。例如,美國(guó)黑人和白人會(huì)更快地將“Brad”和“Courtney”與“快樂(lè)”和“日升”相聯(lián)系,而把名字“Leroy”和“Latisha”與“憎恨”和“惡心”相聯(lián)系。
為了驗(yàn)證機(jī)器“思想”是否具有同樣的偏見(jiàn),Bryson和同事開(kāi)發(fā)了詞向量聯(lián)想測(cè)驗(yàn)(WEAT)。他們從一套已經(jīng)建立的“詞向量”——基本上是計(jì)算機(jī)基于詞匯通常出現(xiàn)的上下文對(duì)一個(gè)詞匯的定義——開(kāi)始。例如,“冰”和“水汽”有著類似的向量,因?yàn)閮蓚€(gè)詞匯經(jīng)常會(huì)出現(xiàn)在與“水”相關(guān)的詞匯中,而極少出現(xiàn)在與“時(shí)尚”相關(guān)的詞匯中。
WEAT測(cè)量的并非人類的反應(yīng)時(shí)間,而是計(jì)算數(shù)字串之間的類似性。Bryson的團(tuán)隊(duì)發(fā)現(xiàn),“Brett”和“Allison”等名字的隱含意義經(jīng)常類似于含有“愛(ài)”和“笑聲”的積極詞匯,而諸如“Alonzo”和“Shaniqua”的名字則更類似于“癌癥”和“失敗”等消極詞匯。對(duì)于計(jì)算機(jī)來(lái)說(shuō),偏見(jiàn)也被融入詞匯中。
IAT還表明,平均來(lái)看,美國(guó)人會(huì)把男性與工作、數(shù)學(xué)和科學(xué)聯(lián)系在一起,而把女性與家庭和文學(xué)藝術(shù)聯(lián)系在一起。年輕人普遍被認(rèn)為比老年人更加快樂(lè)。研究發(fā)現(xiàn)WEAT中也存在所有這些聯(lián)系。利用同樣的技術(shù)測(cè)驗(yàn)?zāi)切┓e極和消極詞匯的引申義的相似性,該程序進(jìn)而推斷出花朵比昆蟲(chóng)更令人喜歡,樂(lè)器比武器更令人愉快。
研究人員接下來(lái)進(jìn)行了一種詞向量事實(shí)聯(lián)想測(cè)驗(yàn)(WEFAT)。該測(cè)驗(yàn)確定了一些詞匯與其他詞匯的關(guān)聯(lián)性有多強(qiáng),隨后對(duì)比了這些聯(lián)想在真實(shí)世界中的實(shí)際情況。例如,它查詢了“保健專家”和“圖書(shū)管理員”以及“女性”和“婦女”這些詞匯的引申義相關(guān)度有多強(qiáng)。對(duì)于每一種職業(yè),它對(duì)比了計(jì)算機(jī)生成的性別聯(lián)想與這一職業(yè)內(nèi)的實(shí)際女性比例。其結(jié)果是相關(guān)性非常強(qiáng)。該團(tuán)隊(duì)4月13日在《科學(xué)》上報(bào)道稱,計(jì)算機(jī)向量可將從常見(jiàn)的對(duì)花的情緒到種族和性別偏見(jiàn)乃至勞動(dòng)力的事實(shí)等所有事情編碼在內(nèi)。
“算式能夠發(fā)現(xiàn)這些非??帷!辈ㄊ款D大學(xué)計(jì)算機(jī)學(xué)家、最近同時(shí)用類似工作做出類似結(jié)果的Tolga Bolukbasi說(shuō),“當(dāng)你在訓(xùn)練這些詞匯的引申義時(shí),實(shí)際上你從未特別地做過(guò)這些標(biāo)注?!庇腥毕莸囊稽c(diǎn)是存在偏見(jiàn)的引申義會(huì)被利用,比如在歸類簡(jiǎn)歷或是申請(qǐng)借貸時(shí)。例如,一臺(tái)計(jì)算機(jī)在搜尋計(jì)算機(jī)程序員時(shí)將“程序員”與男性聯(lián)系在一起,那么男性的簡(jiǎn)歷將會(huì)到達(dá)最頂部。Bolukbasi的工作集中在對(duì)引申義“去除偏見(jiàn)”的方法上,即將不必要的聯(lián)想與一些詞匯剝離。
Bryson還有另一種方法,她沒(méi)有選擇去除偏見(jiàn)的引申義,即丟掉一些信息,而是加入另一層人類或計(jì)算機(jī)判斷來(lái)決定如何或是否運(yùn)用這些偏見(jiàn)。比如在雇傭程序員的案例中,可以設(shè)定性別配額。
人們一直認(rèn)為語(yǔ)義似乎可以合理地從詞匯共存中提取出來(lái)。“但它和此前的結(jié)果大不相同?!蔽餮艌D華盛頓大學(xué)心理學(xué)家、1998年研發(fā)IAT的Anthony Greenwald說(shuō),近日他撰寫(xiě)的關(guān)于WEAT的評(píng)論文章發(fā)表于《科學(xué)》。他表示期待寫(xiě)作(WEAT測(cè)驗(yàn)的基礎(chǔ))能夠更好地反映清晰的態(tài)度,而非模糊的偏見(jiàn)。但取而代之的是,WEAT的引申義比種族和性別態(tài)度調(diào)查結(jié)果更接近或類似IAT偏見(jiàn),這表明人們可能會(huì)以沒(méi)有意識(shí)到的方式通過(guò)語(yǔ)言傳遞偏見(jiàn)?!八羞@些令人吃驚?!彼f(shuō)。他還表示W(wǎng)EAT可通過(guò)測(cè)試19世紀(jì)初撰寫(xiě)的書(shū)籍中詞匯的引申義檢測(cè)此前的模糊偏見(jiàn)。
同時(shí),Byron和同事還表示,即便是谷歌也不能免除偏見(jiàn)。該公司的翻譯軟件在翻譯若干種語(yǔ)言的性別中性名詞時(shí),會(huì)把醫(yī)生翻譯成“他”,而把護(hù)士翻譯成“她”。
所有這些工作“表明如何選擇你的詞匯非常重要”,Byron說(shuō),“對(duì)我來(lái)說(shuō),這實(shí)際上是對(duì)政治正確和平權(quán)行動(dòng)等所有這些事情進(jìn)行辯護(hù)。現(xiàn)在,我看到了它有多重要。”(晉楠編譯)