什么是圖靈測(cè)試?
“機(jī)器是否能夠思考?”,1950年,Alan Turing針對(duì)這個(gè)問(wèn)題提出了一個(gè)著名的思想實(shí)驗(yàn):圖靈測(cè)試(Turing test),用于測(cè)試機(jī)器是否能表現(xiàn)出與人等價(jià)或無(wú)法區(qū)分的智能。
測(cè)試的談話僅限于使用唯一的文本管道,例如計(jì)算機(jī)鍵盤和屏幕,這樣的結(jié)果不依賴于計(jì)算機(jī)把單詞轉(zhuǎn)換為音頻的能力。
測(cè)試內(nèi)容:測(cè)試者與被測(cè)試者(一個(gè)人和一臺(tái)機(jī)器)在不發(fā)生物理接觸的情況下,由測(cè)試者通過(guò)一些裝置(如鍵盤)向被測(cè)試者隨意發(fā)問(wèn)。經(jīng)過(guò)多次測(cè)試后,如果有超過(guò)30%的測(cè)試者不能確定被測(cè)試者是人還是機(jī)器,那么這臺(tái)機(jī)器就通過(guò)了測(cè)試。
計(jì)算機(jī)是否通過(guò)了圖靈測(cè)試?
自從圖靈測(cè)試的概念誕生以來(lái),所有的人工智能均以通過(guò)圖靈測(cè)試為目標(biāo)。那么,70年過(guò)去了,至今為止計(jì)算機(jī)是否通過(guò)了圖靈測(cè)試呢?
2014年6月8日,在Alan Turing逝世60周年紀(jì)念日這一天,英國(guó)皇家學(xué)會(huì)舉行了2014圖靈測(cè)試大會(huì),聊天程序Eugene Goostman成功騙過(guò)了研究人員,并首次“通過(guò)”了圖靈測(cè)試。然而,后來(lái)有文章指出它其實(shí)并未真正通過(guò)所有測(cè)試。
后來(lái),Google的GPT-3通過(guò)圖靈測(cè)試的新聞也業(yè)界引起了廣泛的關(guān)注。然而,對(duì)于此次測(cè)試,有人表示稱贊,也有不少人仍然表示質(zhì)疑。
圖靈測(cè)試已過(guò)時(shí)?
為什么我們至今仍然無(wú)法通過(guò)圖靈測(cè)試?
原因之一是當(dāng)前的人工智能研究者們對(duì)于通過(guò)圖靈測(cè)試的興趣不大,因?yàn)閳D靈測(cè)試的目標(biāo)和當(dāng)前的人工智能研究方向并不完全一致。
主要表現(xiàn)在以下方面:
圖靈測(cè)試幾乎沒(méi)有考慮到人工智能的“機(jī)器”屬性,如高速計(jì)算和信息檢索等功能,而這兩者正是現(xiàn)代計(jì)算機(jī)最擅長(zhǎng)的部分。
要通過(guò)圖靈測(cè)試,人工智能必須能夠“欺騙”人類,而要想完美地欺騙,人工智能必須模仿人類在回答問(wèn)題時(shí)的延遲。例如“129*3256=?”,“北京到上海的距離是多少?”這類的問(wèn)題,普通人作答需要花費(fèi)很長(zhǎng)時(shí)間計(jì)算或查找信息,但計(jì)算機(jī)完全可以立即給出答案。以現(xiàn)在的觀點(diǎn)來(lái)看,讓計(jì)算機(jī)放棄自己的優(yōu)勢(shì)去模擬人類的延遲是完全沒(méi)有必要的。
圖靈測(cè)試僅考慮了文本交流的情況,而沒(méi)有考慮到現(xiàn)在的人工智能已經(jīng)能夠使用各種傳感器,能夠從視覺、聽覺、觸覺等多角度來(lái)感受外部世界。
那么這是否表明圖靈測(cè)試已經(jīng)過(guò)時(shí)呢?
這是大眾對(duì)于圖靈測(cè)試的一個(gè)廣泛誤解。實(shí)際上,圖靈測(cè)試是人工智能的一個(gè)充分條件,它本身并沒(méi)有試圖定義人工智能的范疇。換句話說(shuō),一個(gè)優(yōu)秀的人工智能應(yīng)該“能夠”通過(guò)圖靈測(cè)試,但并不表明圖靈測(cè)試是人工智能的全部。所以,圖靈測(cè)試并沒(méi)有過(guò)時(shí),只不過(guò)現(xiàn)代人工智能研究并沒(méi)有把通過(guò)圖靈測(cè)試作為重點(diǎn)而已。
圖靈測(cè)試與如今的AI發(fā)展
如今人工智能研究的目標(biāo)不再局限于AI是否與人類有區(qū)別,而是發(fā)揮機(jī)器的速度和信息搜索優(yōu)勢(shì),增強(qiáng)人類的智力,改善人們的日常生活。
現(xiàn)在智能手機(jī)的計(jì)算能力都是阿波羅Apollo 11的幾十萬(wàn)倍,再加上云計(jì)算和高帶寬連接,人工智能可以在幾秒鐘內(nèi)根據(jù)大量數(shù)據(jù)做出決策。這些都是普通人無(wú)法完成的事情。基本目標(biāo)之一是讓AI展現(xiàn)類似于人類的智力屬性,包括擁有常識(shí)、自我監(jiān)督以及語(yǔ)言能力,并結(jié)合快速搜索和超強(qiáng)的記憶力,代替人類完成工作。
那么,我們現(xiàn)在應(yīng)該如何評(píng)價(jià)人工智能呢?
亞馬遜于2016年設(shè)立的“Alexa大賽”可以為我們提供一些參考。該比賽的要求是制造一個(gè)“社交機(jī)器人”,而評(píng)判標(biāo)準(zhǔn)則是由人類與該機(jī)器人交談20分鐘,內(nèi)容涉及娛樂(lè)、體育、政治、科技等方方面面,然后由人類以是否愿意與該機(jī)器人再次交談為標(biāo)準(zhǔn)進(jìn)行評(píng)分。
整個(gè)過(guò)程中,人類事先知道交談對(duì)象是機(jī)器人。可以看到,為了讓人類“愿意”與機(jī)器人繼續(xù)交談,機(jī)器人必須優(yōu)先展示出幽默感、同理心等,但模仿人類并不是最優(yōu)先的目標(biāo)。
此外,我們還可以從日常生活對(duì)于人工智能助手的接受程度來(lái)評(píng)價(jià)人工智能的發(fā)展。人工智能想要融入日常生活,就要在人類有需要時(shí)提供幫助,不需要時(shí)退居幕后。例如,它可以在你睡覺時(shí)幫你關(guān)閉忘記關(guān)掉的燈,或者在發(fā)生意外情況時(shí)自動(dòng)報(bào)警等。人工智能還應(yīng)該有能力解決更為通用的任務(wù),而不僅僅是幫你設(shè)置日程安排這種特殊任務(wù),這就要求它必須有足夠強(qiáng)大、足夠通用的自我學(xué)習(xí)能力。
這些評(píng)價(jià)標(biāo)準(zhǔn)都與圖靈測(cè)試相去甚遠(yuǎn),但并不妨礙圖靈測(cè)試成為人工智能的充分條件。
可以認(rèn)為,現(xiàn)代人工智能研究的每個(gè)子領(lǐng)域的成功都是通過(guò)圖靈測(cè)試的必要條件,但各個(gè)子領(lǐng)域距離達(dá)到圖靈測(cè)試的要求還有很大的差距。但是,巨大的社會(huì)價(jià)值推動(dòng)了各個(gè)子領(lǐng)域的發(fā)展。等到真正的通用人工智能實(shí)現(xiàn)那一天,它當(dāng)然可以輕易通過(guò)圖靈測(cè)試,但AI對(duì)于人類社會(huì)的影響早已不僅限于圖靈測(cè)試的范疇。