圖片來源@視覺中國
“城市東部的一所房屋有炸彈即將爆炸!”
“炸彈是由捕鼠器,ACDelco品牌AA電池和鍍鋅管碎片組成的,似乎跟轟炸機有關(guān)。”
“恐怖分子來電,第五枚炸彈已經(jīng)在聯(lián)邦快遞的傳送帶上了!”
上述劇情如果發(fā)生在好萊塢電影里,此刻一定會出現(xiàn)一群運籌帷幄的聯(lián)邦調(diào)查局分析師,在蛛絲馬跡中開展一場爭分奪秒的競賽,利用各種類型的數(shù)據(jù)中,抽絲剝繭,作出預(yù)判,再與一線特工們緊密合作,阻止悲劇的發(fā)生。
這事兒聽起來,是不是比下象棋、寫文章、玩游戲、替人巡邏、流水線“打工人”要炫酷多了?
最近美國情報高級研究項目活動(IARPA)提出利用人工智能來預(yù)測地緣政治事件,進(jìn)而找出恐怖分子、黑客或任何被認(rèn)為是美國敵人的人,所以我們就借此機會,聊聊AI做情報分析師這事兒,到底靠不靠譜。
科學(xué)算命:美國情報機構(gòu)來了一位新員工
IARPA所自主的一些項目,從技術(shù)角度看都是我們熟悉的名字:量子計算、低溫計算、人臉識別、通用語言翻譯等等,這些看起來人畜無害的項目,好像和BAT這種大廠的實驗室沒啥不一樣。
但作為一個由間諜以及博士精英們組成的機構(gòu),一切顯然不會這么簡單,IARPA可以說是美國政府秘密項目中風(fēng)險最大、影響最深遠(yuǎn)的一個,因為它需要告訴決策者未來可能發(fā)生的地緣政治事件。
他們關(guān)注的大多是諸如:G7成員國是否會(在某一特定日期)對敘利亞發(fā)動軍事攻擊?委內(nèi)瑞拉一個月內(nèi)究竟能生產(chǎn)多少石油等等,之類的硬核題材。
那AI在其中扮演了什么角色呢?比如IARPA資助的一個名叫SAGE的項目,就是利用機器學(xué)習(xí)來進(jìn)行協(xié)同預(yù)測,通過合作將大量的人類非專家預(yù)測因子集中起來,使它們“比單一的人類專家預(yù)測得更準(zhǔn)確、更快”。
通過這一混合模型,SAGE可以向人類提供機器從圖表中獲得的信息,將趨勢可視化呈現(xiàn)出來,以及AI做出的具體預(yù)測。
該項目的負(fù)責(zé)人、南加州大學(xué)維特比信息科學(xué)研究所(ISI)人工智能部主任阿蘭·加爾斯泰安(Aram Galstyan),前不久就發(fā)聲說,SAGE成功預(yù)測了朝鮮何時將發(fā)射導(dǎo)彈試射。聽起來是不是很刺激?
放在上古時代,擁有占卜未來能力的AI絕對會成為部落里權(quán)利最高的大巫師。不過子不語亂力亂神,想必大家更想知道這種玄而又玄的能力到底是怎么來的。
耳目、尖兵、參謀:分析師的職場密碼,AI學(xué)會了幾招?
明明AI連預(yù)測個天氣都時準(zhǔn)時不準(zhǔn),怎么就突然能預(yù)報國家大事了?
用南加州大學(xué)計算機科學(xué)家弗雷德·莫爾斯塔特(Fred Morstatter)的話來說,“AI之所以有效,是因為人類有硬幣的一面,而機器有硬幣的另一面”——不是針砭時事、運籌帷幄,而是與以前的分析工具相比,讓人類更加準(zhǔn)確地抵達(dá)未來。說人話就是提高“猜中”的概率和效率。
就拿雙十一剁手來說,電商網(wǎng)站的“猜你喜歡”合你心意的幾率越來越高多了,其中就有分析預(yù)測模型的功勞。
國家大事也同樣遵循這一定律,在各類犯罪行為發(fā)生之前,通過不正常的間諜活動、社交網(wǎng)絡(luò)動態(tài)、消費記錄等等,來分析和研究對象的行為與活動,將潛在損害扼殺在搖籃里。所以AI在政治預(yù)測中起到的作用,更像是一個情報分析師,而非指哪兒打哪兒的超級特工。
一個情報分析師應(yīng)該具備哪些能力?簡單來說有三個:耳目、尖兵、參謀,AI又做到了哪一階段?
1.無處不在的數(shù)字“耳目”。
預(yù)測的前提,是在數(shù)據(jù)收集環(huán)節(jié)就能夠提供給分析師們足夠規(guī)模的準(zhǔn)確而有效的數(shù)據(jù)。
古代的大巫師靠燒龜殼、看星象來“未卜先知”。而IARPA的操作模式,就將數(shù)據(jù)收集通過人工智能進(jìn)行自動化管理,根據(jù)《匹茲堡郵報》的報道,該系統(tǒng)“能夠全天候記錄世界各地所有人的生活。”
其中包括了每一篇Facebook帖子、推特和YouTube視頻;每一個收費站的標(biāo)簽號碼;每一個GPS下載、網(wǎng)絡(luò)搜索和新聞提要;每一個街頭攝像機視頻,甚至是每一次外賣下單和餐廳預(yù)約……
IARPA的系統(tǒng)讓程序沒日沒夜地不斷訪問并抓取這些數(shù)據(jù),輸送到上游來支撐決策。
2.先知先覺的模型“尖兵”。
每個人對數(shù)據(jù)的敏感度和運用能力是不同的,一個對各種信息和情報變化不敏感的人,自然無法從中洞察并做出對未來的判斷和預(yù)測,也就是缺乏態(tài)勢感知(Situation Awareness,SA)的能力,而AI亦如是。
要在讀懂大量信息和情報的基礎(chǔ)上,結(jié)合復(fù)雜的國內(nèi)外政治、經(jīng)濟(jì)、科技、文化環(huán)境等等,找到規(guī)律,這就需要復(fù)雜且高性能的模型了。
模型,也就是一種預(yù)測的基本方法論,就像媒體們總愛拿“義烏指數(shù)”來預(yù)測美國大選結(jié)果(競選者的應(yīng)援道具如旗子等大多是由義烏生產(chǎn)的)一樣。一個有效的預(yù)測模型,可以成為一把尖刀,在紛繁的大數(shù)據(jù)中間庖丁解牛、抽絲剝繭。
這一部分可以說是科技競賽的核心機密了,IARPA到底采用了哪些算法創(chuàng)新我們不得而知,但從大體來看,一般通用的包括決策樹、回歸技術(shù)、聚類算法、深度神經(jīng)網(wǎng)絡(luò)等等,結(jié)合NLP自然語言處理來理解網(wǎng)絡(luò)信息,來綜合判斷事件的走向與結(jié)果。
這也是一個科技廠商的大練兵場,比如在2015年巴西世界杯期間,谷歌、微軟、百度、高盛等巨頭就對全部64場比賽的勝負(fù)結(jié)果,以及冠軍和黑馬進(jìn)行了預(yù)測,哪家準(zhǔn)確率更高大家可以自己搜搜看。
3.不令而信的決策“參謀”。
光有模型,那豈不是沒有人類啥事兒了?如果要評選“最晚被AI搶走崗位的職業(yè)”,那情報分析師一定位居前列。原因無他,分析的目的是為行動服務(wù)的。
尤其是IARPA這樣的情報機構(gòu),最終是要針對各種可能的突發(fā)政治事件、公共危機、恐怖活動等等,迅速產(chǎn)出針對性、國家性的戰(zhàn)略決策。
這就需要兩個前提:第一,創(chuàng)新。分析師更強調(diào)基于隱性知識的處理和分析,并在此基礎(chǔ)上提出自己的論斷和建議。對于未來不確定的事物,個人的既有知識與經(jīng)驗就極為重要了。如果拿情報流程鏈來說的話,數(shù)據(jù)收集與模型分析大概處于前半段,而后半段能改變事情走向的則來自于專家的智慧結(jié)晶。
尤其是一些主觀層面的信息,必須面對面溝通才能從表情、言談舉止中反映出來,依然需要人類分析師出馬,AI在后端提升的效率優(yōu)先;還有一些隱藏信息,像是一些國家大政方針之類的報告等等,在網(wǎng)絡(luò)上可能根本就沒有任何數(shù)據(jù)留存,也讓AI心有余而力不足。在這個AI連小學(xué)生作文都寫不好的當(dāng)下,人類分析師的飯碗自然端的穩(wěn)穩(wěn)的。
IARPA就每3年到5年輪換一批項目經(jīng)理,這些人往往來自各個領(lǐng)域,比如語言學(xué)、航空航天、原子物理、人工智能、生物識別、神經(jīng)科學(xué)等等。
第二,影響力。
分析師所找到的“政策密碼”,不能閉門造車,最終要在現(xiàn)實中接受檢驗,而執(zhí)行力度就取決于其建議被認(rèn)可的程度了。如果是AI上馬,它能保證執(zhí)行者不用三令五申就會遵守服從嗎,能讓隊友們勇往直前時不需要為判斷失誤而擔(dān)憂嗎,預(yù)測錯誤導(dǎo)致行動失敗的責(zé)任又如何劃分呢?
換句話說,分析師兜售的是一種具有不確定性的“思想商品”,這就需要其具備能夠與他人發(fā)生關(guān)系、獲得認(rèn)可,并推動他人更充分地展開行為的能力。
技術(shù)與影響力,在分析師這一角色的能力體系中互為表里。少了后者的AI,目前只能當(dāng)個“工具人”。
讀到這里,或許我們不會對IARPA的AI動作有太高的憂慮感。不過,此前我國也有領(lǐng)導(dǎo)人提出了“從科技規(guī)律出發(fā)前瞻思考世界科技發(fā)展走勢,提出咨詢建議,開展科學(xué)評估,進(jìn)行預(yù)測預(yù)見,在國家宏觀決策中發(fā)揮建設(shè)性作用”的意見。
我們能從IARPA打造AI情報師的經(jīng)驗中,去粗取精找到什么收獲嗎?
變局之前:AI情報待解的隱患
盡管兩國國情不同,但從美國政府機構(gòu)將AI引入情報工作的動作以及引起的輿論反響中,也可以幫我們規(guī)避掉許多不必要的煩惱。
目前來看,IARPA的AI實踐有幾點值得探討。
首先,AI預(yù)測結(jié)果只在小部分范圍內(nèi)有效,并沒有更多案例被曝光。除了技術(shù)本身的原因之外,許多地方的數(shù)據(jù)覆蓋范圍并不普遍也有著直接關(guān)系。數(shù)據(jù)是預(yù)測的前提,數(shù)據(jù)不足自然會出現(xiàn)失真的情況。
還有一些領(lǐng)域的規(guī)律不明顯,充滿了突發(fā)事件和意外影響,比如商界相對于農(nóng)林牧漁等傳統(tǒng)行業(yè),時不時就有人為因素影響,這些都需要不斷實時修正。
因此,AI在信息 、知識的獲取和處理上所體現(xiàn)出的極強能力,值得重視,卻也不用過度緊張。
另外,IARPA在AI情報分析上過度發(fā)力,已經(jīng)開始侵犯公民的信息邊界。此前就有媒體曝出,IARPA對國家安全局收集的數(shù)百萬私人海外通信進(jìn)行數(shù)據(jù)挖掘,盡管其目的是防止恐怖活動,但濫用和侵犯隱私權(quán)的可能性也已經(jīng)引起了不少觀察家的警覺。
在美國,這樣的事情還不在少數(shù),2017年,F(xiàn)acebook收到了來自世界各國政府的78890條信息請求,41%來自美國,其中85%的請求得到了批準(zhǔn),同時也向谷歌、蘋果和其他公司提出了類似的要求。
美國國土安全部(U.S.Department of Homeland Security)的一篇帖子也顯示,他們正試圖創(chuàng)建一個系統(tǒng),能夠“全天候訪問有密碼保護(hù)的影響力人群的個人社交媒體,并從內(nèi)容、情感、數(shù)量等方面進(jìn)行分析”。
如何平衡好公民隱私安全與國家利益之間的問題,考驗著政府對待數(shù)字化、智能化技術(shù)的管理水平。
而在沒有給出具有說服力的共識方案之前,我想大多數(shù)人都會更希望這一天更慢一點到來。