有很多讀者在跟我們交流時,都會提到非常驚訝于人工智能居然可以做這么多令人意想不到的事。從下圍棋到自動駕駛,從辨識古文字到宇宙測繪,似乎有點無所不能的意思。也有讀者希望我們做個專題,專門列一個“你想不到AI居然可以做這些”的清單。
非常非常不好意思,我可以非常負責任的說,這清單太容易了,但問題是根本列不完。即使不考慮技術的可能性,僅僅是每天統(tǒng)計新的論文和研究報告里又讓AI能做什么了,那都是個近乎無法完成的工作。
但這并不是說AI已經(jīng)無所不能。事實上,AI在絕大多數(shù)基礎工作中并沒有傳統(tǒng)計算機效率高,完全談不上取而代之。AI總能在意想不到的領域冒出來,是因為它采取了完全不同的底層策略,專注于解決那些經(jīng)典計算和人工無法解決的問題。
所謂魚不如漁,與其大家一起感嘆“AI居然能做這個!”不如來思考“如何知道AI還能做哪些”。想要獲得這個能力,就需要知道今天主流AI解決方案的依據(jù)是什么。這就不得不提一個對AI發(fā)展至關重要的名字:貝葉斯。
想要尋找上帝,卻找到了人工智能
假如沒有貝葉斯他老人家,實在很難想象今天的人工智能會怎樣。也不僅是人工智能,可能統(tǒng)計學、應用數(shù)學、測繪學、醫(yī)學,甚至犯罪學都會受到巨大的影響。
但對學術如此重要的一個人,卻根本不是一位科學家。生活在300年前的托馬斯·貝葉斯,是英國的一名牧師。當然,同時還是一位業(yè)余數(shù)學家。
可能是出于把愛好和工作融合到一起的考慮吧。貝葉斯提出了將歸納法應用于概率統(tǒng)計的方法,希望能以此向世人證明上帝是存在的。但很不幸,三百年之后上帝存在的依據(jù)依然未找到,但貝葉斯決策卻在無數(shù)科學領域開花結果。
所謂貝葉斯歸納,其實基礎原理非常簡單。比如說一個人做了一件好事,那他是不是個好人呢?顯然不一定。但是假如一個人每天都做好事,那他是不是一個好人呢?其實也不一定,也可能他在背后十惡不赦喪盡天良,但假如沒有他做壞事的證據(jù),每天做好事就是好人顯然已經(jīng)概率非常大了。
這就是貝葉斯歸納的核心邏輯:不必獲取所有證據(jù)之后再進行判斷,而是結合已知條件先進行判斷,再通過數(shù)據(jù)不斷去驗證、調(diào)整、修改這個判斷,讓它無盡趨于合理化。
這個邏輯聽起來蠻簡單的,并且好像還有點不靠譜,在貝葉斯生前他的想法甚至沒有發(fā)表出來。即使其死后的兩百多年里,貝葉斯歸納也沒有得到多少重視。因為從數(shù)據(jù)嚴謹性出發(fā)的經(jīng)典統(tǒng)計學顯然可以更好的接觸事物本質,而不是像貝葉斯歸納一樣用“猜”來開啟計算。
直到上世紀七八十年代之后,沉寂百多年的貝葉斯理論開始重新在統(tǒng)計學中被重視。
因為經(jīng)典統(tǒng)計學雖然可靠,但是卻需要依靠完整的數(shù)據(jù)模型,往往效率太低,無法滿足實際需求。
比如說在搜尋海面遇難船只時,經(jīng)典統(tǒng)計學需要每個海域的氣象數(shù)據(jù)、監(jiān)控數(shù)據(jù)、過往船只數(shù)據(jù),然后綜合計算這些因素來精準定位。但事實上,這些數(shù)據(jù)是不可能馬上齊全的,即使可以,分秒必爭的搜救工作也不能等。
而用貝葉斯理論來解決這個問題,會先讓有經(jīng)驗的專家主觀判斷船只失事海域,然后通過不斷獲得的數(shù)據(jù)一點點修正專家的判斷,爭取在最短時間內(nèi)解決問題——這就是著名的1968年美國天蝎號潛艇失事事件,也是貝葉斯理論進入應用化的標志。
貝葉斯理論在工作中強調(diào)從人類先驗知識出發(fā),對目標進行模糊判斷,然后不斷學習進行判斷校對,這成為了后來大量人工智能技術的誕生起點。
300年前,本來希望用來證明上帝存在的理論,在300年后卻成為了人工智能的基礎,這是一個悲傷的故事呢?
還是說貝葉斯牧師其實已經(jīng)找到了正確答案?
貝葉斯意識:一切學習型AI的基礎
與0和1組成的經(jīng)典計算不同,貝葉斯計算不需要建立在完整的數(shù)據(jù)基礎上就能獲得答案。這種不完全數(shù)據(jù)推理能力,與人類思維中的認知與判斷過程非常相似。于是產(chǎn)生了數(shù)量眾多的貝葉斯理論與AI結合,運用于不完全信息推導的技術模型。
比如說貝葉斯網(wǎng)絡、貝葉斯分類器、貝葉斯邏輯,都是如今非?;A的AI工具。貝葉斯網(wǎng)絡更是可以看做機器學習理論自證有效的基礎條件。而貝葉斯方法也被廣泛運用在NLP、機器視覺、知識圖譜等領域,成為優(yōu)化結果型算法與技術的支撐。
在我們的生活中,貝葉斯可謂無處不在。比如說有沒有感覺你的手機拍視頻或者直播正在越來越清晰?這其中很大一個原因在于攝像算法中運用了貝葉斯邏輯加持下的視頻優(yōu)化算法,通過對抗生成來獲得更清晰自然的拍攝效果,也就是所謂的視頻美顏。
從另一個角度也可以論證貝葉斯對人工智能的重要性。上世紀70年代,曾經(jīng)有過一次比較短暫的AI復興。當時知識表示和專家系統(tǒng)成為了人工智能的主角,人們希望用超級計算機來歸納人類的所有知識,進行網(wǎng)絡化。最終所有問題都可以在其中找到答案。
這種模式在當時贏得了大量資金與關注,卻在短短幾年間宣告破產(chǎn)。因為人類知識和數(shù)據(jù)太復雜了,收集所有知識只具有理論上的可能性,現(xiàn)實操作遙遙無期。
而今天以機器學習為主要特征的AI二次復興,很大程度收益于貝葉斯意識帶來的思維轉變:人類不用收集一大堆知識,只需要從一部分已有知識出發(fā),讓機器不斷去學習和驗證自身能力,不斷提高就可以了。畢竟人類需要的不是全能全知的存在,只要智能體可以比人類更強就夠了。
可以說,貝葉斯意識依靠著對現(xiàn)實變化的高度敏感,已經(jīng)成為今天一切學習型AI的基礎。了解了貝葉斯意識中從不完整出發(fā),逐步向完整邁進的邏輯,也就懂了未來AI還能做出什么。
人類大腦和技術未來的殊途同歸
有學者認為,貝葉斯意識可能是最接近人類大腦思維模式的應用數(shù)學邏輯。就像讓一個孩子去認識狗,不必教他狗的種類、科屬、習性,也用把狗的耳朵、鼻子、四肢都變成數(shù)據(jù)讓他理解。孩子會馬上知道這是狗,然后在自己不斷的學習里去加強對狗的認識,知道狗有不同種類,知道狼與狗的區(qū)別等等。
所以我們過去在思考很多問題時,會主動的讓大腦像計算機一樣去想象。在移動互聯(lián)網(wǎng)時代,我們又習慣了以手機為中心去思考一切。但在人工智能時代,貝葉斯意識告訴我們:也許人類該像人類自己一樣去思考了。
在某些技術奇點之后,機器已經(jīng)可以在局部區(qū)域像人類一樣通過局部知識去認知、推理和判斷復雜問題。最好的例子可能就是AlphaGo ZERO的出現(xiàn)。其實AlphaGo的邏輯就是一種貝葉斯思維,要知道對圍棋來說經(jīng)典計算是無法窮盡所有變化的,暴力窮舉只能帶來死機。
而AlphaGo采取的,是讓智能體去學習圍棋規(guī)則,然后大量學習人類棋譜,這就是貝葉斯歸納中不斷吸收數(shù)據(jù)校準目標。在實戰(zhàn)的時候,智能體內(nèi)部算法還會自我驗證每一步預測的合理性,最終求得最優(yōu)解。
而在一定的積累后,AlphaGo這個貝葉斯體系就可以不再依賴人類提供的數(shù)據(jù),而是通過對優(yōu)質數(shù)據(jù)進行自我學習,從而在短時間內(nèi)產(chǎn)生了秒殺上一代的能力。這可以看做貝葉斯體系拜托了對初級數(shù)據(jù)的依賴,進入了進一步自我校準的過程。
有理由相信,此后這類現(xiàn)象會陸續(xù)出現(xiàn)更多。因為人腦的學習能力有若干限制,但貝葉斯智能體卻沒有。
通過模糊知識,進行不斷學習,最終通往廣義未知。很可能是人腦與技術未來的共同方向。至少目前來看,這種技術邏輯在前瞻性科學中的應用已經(jīng)越來越多。比如量子貝葉斯、貝葉斯基因算法等等。
而另一方面,想知道人工智能還能在哪些領域做出驚人之舉。不妨也像貝葉斯一樣去思考:首先這個領域是否存在效率、可靠性、成本比率、盲目性等問題,如果有的話是否必要引入AI。其次看一下這個領域是不是存在先驗知識,作為智能體的基礎。再次看一下這個領域能否源源不斷產(chǎn)生提供給機器學習的數(shù)據(jù)和知識。
如果這幾個條件都確立,那么AI已經(jīng)不遠了。
經(jīng)過PC到手機的漫長教化,我們可能已經(jīng)習慣了數(shù)字化的世界運行。但人工智能卻可能打破人與計算機的經(jīng)典搭配,利用人的感知與學習能力和計算機的運算能力來打開另一條路。也許已經(jīng)是時候改變一下互聯(lián)網(wǎng)思維,讓大腦去和人工智能產(chǎn)生多一點點默契了。