本文由公眾號(hào)“蘇寧財(cái)富資訊”原創(chuàng),作者為蘇寧金融研究院金融科技研究中心副主任沈春澤。
隨著人工智能技術(shù)的發(fā)展,在一些場(chǎng)景的應(yīng)用也越來(lái)越成熟,人工智能正在逐步滲透進(jìn)人們生活的各個(gè)角落,甚至在這次的抗擊新冠疫情中也扮演了重要角色。
新技術(shù)的應(yīng)用
對(duì)比2003年的非典,此次新冠疫情在癥狀上潛伏期更長(zhǎng),傳染性更強(qiáng),而且還碰上了流感爆發(fā)以及春運(yùn)流動(dòng)的節(jié)點(diǎn),因此病情人數(shù)不斷上升,在防治上面臨了更大的困難。
正因如此,在大規(guī)模傳染之后,現(xiàn)有的醫(yī)療資源難以滿(mǎn)足不斷增長(zhǎng)的病患用戶(hù)。為了實(shí)現(xiàn)更好的管控防治效果,提高效率,不少企業(yè)紛紛應(yīng)用諸多技術(shù)手段來(lái)抗擊疫情。比如有些地方推出了智能機(jī)器人,通過(guò)語(yǔ)音識(shí)別、自然語(yǔ)義理解等技術(shù),針對(duì)疫情問(wèn)題、就醫(yī)注意、防護(hù)措施進(jìn)行回答。對(duì)于正常用戶(hù)、輕癥用戶(hù)來(lái)說(shuō),人工智能可以起到一定的答疑作用,避免醫(yī)療資源緊缺以及交叉感染的風(fēng)險(xiǎn)。
其實(shí),人工智能還被應(yīng)用于疫苗研發(fā),比如使用深度學(xué)習(xí)技術(shù),可以協(xié)助科研人員進(jìn)行數(shù)據(jù)分析、快速篩選文獻(xiàn)以及相應(yīng)的測(cè)試工作。此外,人工智能還可以應(yīng)用于建立模型以觀察疫情傳播。早前,國(guó)內(nèi)基于AI和大數(shù)據(jù)的流感實(shí)時(shí)預(yù)測(cè)模型便登上了《柳葉刀》的子刊,為傳染病預(yù)測(cè)提供了更加精準(zhǔn)的邏輯框架。
神奇的算法
人工智能技術(shù)為何能發(fā)揮出如此大的作用,魔力的來(lái)源究竟是什么?
人工智能在這些年的快速發(fā)展主要得益于算力提升、數(shù)據(jù)積累和算法創(chuàng)新。其中,算法是人工智能的靈魂,是魔力的主要來(lái)源,今天我們就一起來(lái)看一看這些算法的本來(lái)模樣。
算法(Algorithm)這個(gè)概念比較抽象,是指一個(gè)準(zhǔn)確而完整的關(guān)于解題方案的描述,用系統(tǒng)的方法描述解決問(wèn)題的策略。簡(jiǎn)單地說(shuō),算法就是解決問(wèn)題的處理步驟,一個(gè)生活中的例子就是我們烹飪的時(shí)候往往需要食譜的幫助,食譜描述了美味料理的制作方法,對(duì)制作料理這個(gè)問(wèn)題給出了方案,并將操作步驟規(guī)范地描述出來(lái)。
算法一詞來(lái)源已久,截止目前,網(wǎng)上不完全統(tǒng)計(jì)有2000多個(gè)算法,如果考慮到每個(gè)算法的各類(lèi)變種,數(shù)量極其巨大。但是這些算法按照模型訓(xùn)練方法的差異,總體上可以分為四個(gè)類(lèi)別:有監(jiān)督學(xué)習(xí)(Supervised Learning)、無(wú)監(jiān)督學(xué)習(xí)(Unsupervised Learning)、半監(jiān)督學(xué)習(xí)(Semi-supervised Learning)和強(qiáng)化學(xué)習(xí)(Reinforcement Learning)。這些算法是如何讓機(jī)器具備了“智能”,它們作用的原理是什么?今天,我們嘗試用幾個(gè)樣例來(lái)揭開(kāi)背后的秘密。
1、有監(jiān)督學(xué)習(xí)
有監(jiān)督學(xué)習(xí)被稱(chēng)為“有老師的學(xué)習(xí)”,所謂的老師就是標(biāo)簽。通過(guò)標(biāo)注好的樣本(即訓(xùn)練樣本以及其對(duì)應(yīng)的目標(biāo))訓(xùn)練得到一個(gè)最優(yōu)模型,再利用這個(gè)模型對(duì)輸入的數(shù)據(jù)進(jìn)行判斷給出結(jié)果,從而具備對(duì)未知數(shù)據(jù)進(jìn)行預(yù)測(cè)的能力。
在建立預(yù)測(cè)模型的時(shí)候,監(jiān)督式學(xué)習(xí)建立一個(gè)學(xué)習(xí)過(guò)程,將預(yù)測(cè)結(jié)果與“訓(xùn)練數(shù)據(jù)”的實(shí)際結(jié)果進(jìn)行比較,不斷地調(diào)整預(yù)測(cè)模型,直到模型的預(yù)測(cè)結(jié)果達(dá)到一個(gè)預(yù)期的準(zhǔn)確率。這也比較符合我們的認(rèn)知習(xí)慣,比如我們通過(guò)圖片或?qū)嵨飳W(xué)習(xí)什么是貓、什么是狗等。
經(jīng)典的有監(jiān)督學(xué)習(xí)算法有:反向傳播神經(jīng)網(wǎng)絡(luò)、波爾茲曼機(jī)、卷積神經(jīng)網(wǎng)絡(luò)、多層感知器、循環(huán)神經(jīng)網(wǎng)絡(luò)、樸素貝葉斯、高斯貝葉斯、多項(xiàng)樸素貝葉斯、分類(lèi)和回歸樹(shù)、ID3算法、C4.5算法、C5.0算法、隨機(jī)森林、線(xiàn)性回歸、邏輯回歸、支持向量機(jī)等。
這些專(zhuān)業(yè)名稱(chēng)不重要,我們以大名鼎鼎的AlphaGo為例來(lái)了解一下有監(jiān)督學(xué)習(xí)的原理。從2016年到2017年,這個(gè)圍棋機(jī)器人在多種場(chǎng)合以絕對(duì)優(yōu)勢(shì)戰(zhàn)勝了數(shù)十位頂尖的人類(lèi)棋手。圍棋界公認(rèn)AlphaGo圍棋的棋力已經(jīng)超過(guò)人類(lèi)職業(yè)圍棋頂尖水平,在GoRatings網(wǎng)站公布的世界職業(yè)圍棋排名中,其等級(jí)分曾超過(guò)排名人類(lèi)第一的棋手。
AlphaGo為了解決圍棋的復(fù)雜問(wèn)題,結(jié)合了有監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的優(yōu)勢(shì),通過(guò)標(biāo)注數(shù)據(jù)訓(xùn)練形成一個(gè)策略網(wǎng)絡(luò),將棋盤(pán)上的當(dāng)前棋子的布局狀態(tài)作為輸入信息,對(duì)所有可能的下一步落子位置生成一個(gè)概率分布。以 -1(對(duì)手勝利)到1(AlphaGo勝利)為標(biāo)準(zhǔn),預(yù)測(cè)所有落子位置的得分。也就是說(shuō),針對(duì)每個(gè)棋盤(pán)狀態(tài)定義了一個(gè)學(xué)習(xí)目標(biāo),如此大量的循環(huán)往復(fù),模型學(xué)會(huì)了應(yīng)對(duì)不同的棋盤(pán)布局能夠預(yù)測(cè)最佳落子位置,最終取得令人矚目的成果。
2、無(wú)監(jiān)督學(xué)習(xí)
無(wú)監(jiān)督學(xué)習(xí)被稱(chēng)為“沒(méi)有老師的學(xué)習(xí)”,相比有監(jiān)督學(xué)習(xí)的不同之處在于,不使用事先標(biāo)注的訓(xùn)練樣本,沒(méi)有訓(xùn)練的過(guò)程,而是直接拿無(wú)標(biāo)注的數(shù)據(jù)進(jìn)行建模分析,通過(guò)機(jī)器學(xué)習(xí)自行學(xué)習(xí)探索,從數(shù)據(jù)集中發(fā)現(xiàn)和總結(jié)模式或者結(jié)構(gòu)。
典型的無(wú)監(jiān)督學(xué)習(xí)算法包括:生成對(duì)抗網(wǎng)絡(luò)(GAN)、前饋神經(jīng)網(wǎng)絡(luò)、邏輯學(xué)習(xí)機(jī)、自組織映射、Apriori算法、Eclat算法、DBSCAN算法、期望最大化、模糊聚類(lèi)、k-means算法等。
這里以k-means算法為例來(lái)看看無(wú)監(jiān)督學(xué)習(xí)背后的運(yùn)行機(jī)制,這是一種用來(lái)計(jì)算數(shù)據(jù)聚類(lèi)的算法。
例如,對(duì)上圖中的A、B、C、D、E五個(gè)點(diǎn)聚類(lèi),主要方法是不斷地設(shè)定并調(diào)整種子點(diǎn)的位置,計(jì)算離種子點(diǎn)最近的均值,最終根據(jù)距離聚成群?;疑氖情_(kāi)始時(shí)設(shè)定的種子點(diǎn),首先,計(jì)算五個(gè)點(diǎn)與種子點(diǎn)之間直接的距離,然后,將種子點(diǎn)逐步移動(dòng)到點(diǎn)群的中心。最終,A、B、C和D、E分別根據(jù)離種子點(diǎn)的距離聚類(lèi)為點(diǎn)群。
這個(gè)方法看上去很簡(jiǎn)單,但是應(yīng)用的范圍非常廣泛,包括給網(wǎng)頁(yè)文本進(jìn)行主題分類(lèi);分析一個(gè)公司的客戶(hù)分類(lèi),對(duì)不同的客戶(hù)使用不同的商業(yè)策略;電子商務(wù)中分析商品相似度,歸類(lèi)商品,從而得出不同的銷(xiāo)售策略等。
曾有人做過(guò)一個(gè)有趣的分析,給亞洲15支足球隊(duì)的2005年到2010年的戰(zhàn)績(jī)做了一個(gè)表,然后用k-Means把球隊(duì)歸類(lèi),得出了下面的結(jié)果,來(lái),感覺(jué)一下是否靠譜?
亞洲一流:日本、韓國(guó)、伊朗、沙特;
亞洲二流:烏茲別克斯坦、巴林、朝鮮;
亞洲三流:中國(guó)、伊拉克、卡塔爾、阿聯(lián)酋、泰國(guó)、越南、阿曼、印尼。
3、半監(jiān)督學(xué)習(xí)
半監(jiān)督學(xué)習(xí),處在有監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)的中間帶,其輸入數(shù)據(jù)的一部分是有標(biāo)簽的,另一部分沒(méi)有標(biāo)簽,而沒(méi)標(biāo)簽數(shù)據(jù)的數(shù)量往往遠(yuǎn)大于有標(biāo)簽數(shù)據(jù)數(shù)量(這也是符合現(xiàn)實(shí)情況的)。常見(jiàn)的半監(jiān)督學(xué)習(xí)類(lèi)算法包含:生成模型、低密度分離、基于圖形的方法、聯(lián)合訓(xùn)練等。
4、強(qiáng)化學(xué)習(xí)
強(qiáng)化學(xué)習(xí),主要是讓機(jī)器從一個(gè)狀態(tài)轉(zhuǎn)變到另一個(gè)狀態(tài),當(dāng)完成任務(wù)時(shí)獲得高分獎(jiǎng)勵(lì),但是沒(méi)有完成任務(wù)時(shí),得到的是低分懲罰,這也是強(qiáng)化學(xué)習(xí)的核心思想。常見(jiàn)的強(qiáng)化學(xué)習(xí)類(lèi)算法包含:Q學(xué)習(xí)、狀態(tài)-行動(dòng)-獎(jiǎng)勵(lì)-狀態(tài)-行動(dòng)(SARSA)、DQN、策略梯度算法、基于模型強(qiáng)化學(xué)習(xí)、時(shí)序差分學(xué)習(xí)等。
強(qiáng)化學(xué)習(xí)是近些年大家研究的一個(gè)重點(diǎn),我們以Q學(xué)習(xí)為例說(shuō)明(此處,引用了McCullock一個(gè)非常好的樣例)。假設(shè)一個(gè)房子有五個(gè)房間,房間之間通過(guò)門(mén)連接,從0到4編號(hào),屋外視為一個(gè)單獨(dú)的房間,編號(hào)為5,如下方左圖。
我們把左面的圖轉(zhuǎn)換一下,房間作為節(jié)點(diǎn),如果兩個(gè)房間有門(mén)相連,則中間用一條邊表示,得到上方右圖。
假設(shè)我們的目標(biāo)是從屋內(nèi)任意一個(gè)房間走到屋外,即編號(hào)5,2號(hào)房間是起點(diǎn),每條邊設(shè)定獎(jiǎng)勵(lì)值,指向5的為100,其他為0,可以發(fā)現(xiàn),通過(guò)得分獎(jiǎng)勵(lì),從2到3,再到1或4,最終路線(xiàn)會(huì)收斂到5。
相對(duì)于以往的算法,強(qiáng)化學(xué)習(xí)更符合人類(lèi)學(xué)習(xí)的習(xí)慣,在近年來(lái)被寄予了很高的期望,特別是隨著DeepMind 和 AlphaGo 的成功,強(qiáng)化學(xué)習(xí)日益受到關(guān)注。
榮光和局限
人工智能技術(shù)在這次疫情防控中的應(yīng)用,離不開(kāi)大量的算法工作。比如谷歌用AI技術(shù)幫助科學(xué)家研究病毒特征,亞馬遜探索用疫苗等方式來(lái)治愈普通感冒等。
當(dāng)然,人們也不需要把人工智能奉為神明,如果仔細(xì)研究一下上文列舉的例子就會(huì)發(fā)現(xiàn),人工智能擅長(zhǎng)處理的是在有限、透明規(guī)則、特定任務(wù)下的問(wèn)題,因而在以計(jì)算為主要特征的領(lǐng)域取得了不錯(cuò)的效果,但是對(duì)于其他問(wèn)題,比如自然語(yǔ)言理解、圖像理解等仍然面臨較多的挑戰(zhàn)。