2019年7月30日,知識(shí)智能高峰論壇暨清華大學(xué)(計(jì)算機(jī)系)—中國(guó)工程科技知識(shí)中心“知識(shí)智能聯(lián)合研究中心”(下稱聯(lián)合中心)年度報(bào)告會(huì)在清華大學(xué)廖凱原樓會(huì)議廳舉行。
以下是人工智能研究院院長(zhǎng)張鈸院士在題為“知識(shí)在人工智能的位置”報(bào)告上的演講內(nèi)容,文摘菌進(jìn)行了不改變?cè)獾恼恚?/p>
張鈸院士作題為“知識(shí)在人工智能的位置”的報(bào)告
我們對(duì)人類大腦和智能了解很少,憑什么有可能做人工智能呢?做法很簡(jiǎn)單,這需要我們“大膽假設(shè)、小心求證”。
大膽假設(shè)
假設(shè)之一體現(xiàn)在人類智能,人腦中的活動(dòng)是可以用符號(hào)來進(jìn)行描述的。人類的智能行為,是受到腦中智能符號(hào)處理這樣一個(gè)過程控制的,這就是所謂的物理符號(hào)系統(tǒng),它是智能的充分和必要條件,這是一個(gè)非常大膽的假設(shè),提出這些假設(shè)的人主要都是認(rèn)知心理學(xué)家,他們假設(shè)人類的智能行為都能清晰的表達(dá)出來,這使得人工智能進(jìn)入到符號(hào)聯(lián)結(jié)的時(shí)代。
這個(gè)假設(shè)對(duì)于人類理性思維是很正確的描述,人類理性智能來自于何處?人類理性主要來源于兩個(gè)方面:一是先前的知識(shí)與經(jīng)驗(yàn),二是推理能力。名醫(yī)為什么醫(yī)術(shù)那么高超,就是因?yàn)樗胸S富的醫(yī)學(xué)知識(shí)和臨床經(jīng)驗(yàn),第二就是熟練嚴(yán)謹(jǐn)?shù)耐评砟芰?,從病人的癥狀推理到他可能發(fā)生的疾病,所以用先前的模型描述人類的理性智能是很正確的,但是,這個(gè)假設(shè)有遇到困難,主要表現(xiàn)在以下方面,知識(shí)是人類理性的基礎(chǔ),但是知識(shí)和經(jīng)驗(yàn)很難自動(dòng)獲取,不確定性等使得第一代人工智能受到挫敗,知識(shí)的獲取、表達(dá)遇到障礙。
第二個(gè)假設(shè)——亞符號(hào)系統(tǒng)。深度學(xué)習(xí)、機(jī)器學(xué)習(xí)來源于此,人類的智能行為就是因?yàn)樯窠?jīng)元的活動(dòng),這種活動(dòng)我們應(yīng)該建立怎么樣的模型?我們應(yīng)該用什么樣的模型模擬人工神經(jīng)網(wǎng)絡(luò)的計(jì)算過程?40年后人們找到合適的算法,這就是現(xiàn)今我們講到的深度學(xué)習(xí)。
深度學(xué)習(xí)解決了兩大問題:
1、對(duì)于原始的信息輸入沒有要求,早期的輸入需要人工標(biāo)注和一部分先驗(yàn)知識(shí);
2、最終性能提高了很多。
深度學(xué)習(xí)改變了人工智能的面貌,推進(jìn)了人工智能的發(fā)展,但是深度學(xué)習(xí)也是有缺陷的,深度學(xué)習(xí)做出的系統(tǒng)缺陷很大,危險(xiǎn)性很大,機(jī)器盡管能識(shí)別不同的物體,但它本質(zhì)上并不認(rèn)識(shí)這個(gè)物體,機(jī)器只有感覺,沒有感知,在說感知之前有必要先了解一下什么是知識(shí)。
什么是知識(shí)?機(jī)器會(huì)瞎說,毫無自知之明?
知識(shí)包含四個(gè)方面:
1、理性知識(shí):來自于教育、來自于學(xué)習(xí)、來自于邏輯推理,這一部分知識(shí)是可以清晰和準(zhǔn)確表達(dá)的,這屬于“知其然,又知其所以然”的,“we konw what we know”。
2、感性知識(shí):這一部分知識(shí)來自人類的感知,這一類知識(shí)屬于“知其然,不知其所以然”的,一般很難清晰的表達(dá),這一類知識(shí)同樣重要,那怎么表達(dá)?怎么獲?。恳彩乾F(xiàn)今研究的關(guān)鍵。
3、常識(shí);
4、自我知識(shí)。
知識(shí)的魅力在于“知道我知道什么”和"知道我不知道什么“,認(rèn)識(shí)自我的不足是智能的重要表現(xiàn),從這一點(diǎn)看機(jī)器還沒有上升到認(rèn)知層面,魯棒性差,完全沒有“自知之明”,會(huì)瞎說,因?yàn)樗耆恢雷约翰恢朗裁础?/p>
一個(gè)很形象的例子,如果讓機(jī)器翻譯“說你行的人行”這句話,機(jī)器翻譯的結(jié)果可能是:“Talk about the pedestrian line of your profession”完全背離了原意。
怎么樣讓機(jī)器有“自知之明”?到現(xiàn)在為止,人類還沒有解決。
人工智能面臨兩大障礙
所以,目前人工智能遇到兩大障礙:
現(xiàn)在的人工智能,只能處理確定性強(qiáng)的數(shù)據(jù)處理任務(wù),對(duì)突發(fā)狀況的處理仍然漏洞百出,如復(fù)雜環(huán)境下的自動(dòng)駕駛,在突發(fā)情況下的處理能力仍然差強(qiáng)人意,而我們很難將人類司機(jī)的經(jīng)驗(yàn)傳授給機(jī)器,人類出生開始就以無監(jiān)督的學(xué)習(xí)方式來觀察、聆聽周圍的事物,而機(jī)器相比人類是沒有生活的,而且它的知識(shí)也不會(huì)不斷地更新,常識(shí)知識(shí)對(duì)智能系統(tǒng)還是很重要。
第二大障礙,將語(yǔ)義映射到符號(hào)空間,難免會(huì)丟失一部分信息,如何在機(jī)器翻譯中加入感性的知識(shí)也是一大難點(diǎn)和挑戰(zhàn),現(xiàn)今深度學(xué)習(xí)在有些方面為什么不能和人來抗衡呢?因?yàn)槿说拇竽X神經(jīng)元很復(fù)雜,現(xiàn)今用的神經(jīng)網(wǎng)絡(luò)都只是簡(jiǎn)單的模擬,后續(xù)的發(fā)展還需要進(jìn)一步向神經(jīng)科學(xué)學(xué)習(xí)。
如何突破障礙
最后,我們需要知識(shí)、數(shù)據(jù)、算法、算力這幾個(gè)資源的配合。
●針對(duì)第一道障礙,需要智能系統(tǒng)做到隨機(jī)應(yīng)變、舉一反三,知識(shí)在其中發(fā)揮著重要的角色,需要在系統(tǒng)中嵌入不確定知識(shí)與推理、常識(shí)與常識(shí)推理。
●對(duì)于第二道障礙,需要數(shù)據(jù)+知識(shí),克服純數(shù)據(jù)驅(qū)動(dòng)帶來問題。
隨后聯(lián)合中心主任唐杰、首席科學(xué)家李涓子、劉奕群和周源分別介紹了智能科技情報(bào)挖掘平臺(tái)AMiner、大規(guī)模知識(shí)圖譜XLORE構(gòu)建關(guān)鍵技術(shù)、群體智能支撐的互聯(lián)網(wǎng)搜索技術(shù)及其應(yīng)用,以及支持技術(shù)預(yù)見的多源異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)融合研究的工作。