德?lián)淙斯ぶ悄堋袄鋼浯髱煛笔讋僦袊堉牐铋_復(fù)認(rèn)為人類沒有贏的可能

鈦媒體
蔡荻
4月6日,德州撲克人機大戰(zhàn)結(jié)束了首日的賽程,在昨日上午的比賽中,人工智能“冷撲大師”暫時領(lǐng)先14145記分牌。 該場“人機大戰(zhàn)”由創(chuàng)新工場CEO暨創(chuàng)新工場人工智能工程院院長李開復(fù)博士發(fā)起, 邀請母校美...

4月6日,德州撲克人機大戰(zhàn)結(jié)束了首日的賽程,在昨日上午的比賽中,人工智能“冷撲大師”暫時領(lǐng)先14145記分牌。

該場“人機大戰(zhàn)”由創(chuàng)新工場CEO暨創(chuàng)新工場人工智能工程院院長李開復(fù)博士發(fā)起, 邀請母校美國卡內(nèi)基梅隆大學(xué)(Carnegie Mellon University)知名的Libratus撲克機器人主創(chuàng)團隊訪問中國,于海南進(jìn)行一場“冷撲大師 VS 中國龍之隊—人工智能和頂尖牌手巔峰表演賽”。

這也是亞洲首度舉辦的人工智能與真人對打的撲克賽事。

冷撲大師是基于卡內(nèi)基梅隆大學(xué)(CMU)Tuomas Sandholm教授和博士生Noam Brown所開發(fā)的Libratus無限德州撲克人工智能系統(tǒng)。今年1月份曾在美國匹茲堡的比賽中,將四位職業(yè)選手挑落馬下,贏走接近總數(shù)的籌碼。

對戰(zhàn)方“中國龍之隊”則由2016年世界德州撲克大賽WSOP金手鏈冠軍得主杜悅領(lǐng)軍。戰(zhàn)隊成員中許朝軍、張淮、童舟、朱亞希、王天建均為撲克玩家圈內(nèi)熟知的頂級高手。其中,杜悅此前是人人網(wǎng)集團副總裁,曾在2016年的世界德州撲克大賽WSOP的無限注德州撲克賽事中獲得冠軍。

比賽于4月6日至10日舉行,為期五天,總共要進(jìn)行36000副手牌的比拼,獲勝一方將獲得200萬元獎金。

首日上半場比賽結(jié)束后,有不少網(wǎng)友反映:冷撲大師并沒有像AlphaGo對戰(zhàn)人類棋手那樣,呈現(xiàn)壓倒性的優(yōu)勢。

對此,李開復(fù)回應(yīng)道,冷撲大師幾乎沒有輸?shù)目赡堋R驗槔鋼浯髱熌艽驍∶绹谲?,中國冠軍雖然很強,但還是不如美國冠軍強,所以理論上應(yīng)該是沒有機會的。目前優(yōu)勢不明顯,和機器學(xué)習(xí)還沒打開有關(guān)。

另外,從技術(shù)上分析,同圍棋相比,撲克的游戲規(guī)則更像是在處理真實世界的問題。這是一種有關(guān)不確定性的游戲。玩家并不知道對手手中的牌,也不清楚會拿到什么牌,這個過程中同時摻雜著各式的詐和招數(shù)。

但Libratus背后并沒有使用心理戰(zhàn)的機制,它所依靠的仍然是大量的數(shù)學(xué)。Libratus也沒有AlphaGo使用的深度學(xué)習(xí)技術(shù),而是依賴于一種比較古典的線性規(guī)劃,一種極其強調(diào)試錯的方法。

舉例來說,AlphaGo是通過分析人類玩家的3000萬棋譜來學(xué)習(xí)的,Libratus卻是從零開始,通過自己跟自己玩大量的游戲進(jìn)行學(xué)習(xí)。Libratus還利用了博弈論,通過平衡風(fēng)險與收益來決定自己的下一步。

Liberatus使用了美國匹茲堡的超級計算中心來完成比賽,每做出一個決策大概需要5到10秒鐘。如同人類選手在每場比賽后會聚在一起商討后續(xù)的計劃,每個夜晚,Libratus 也會使用這臺超級計算機優(yōu)化策略。

關(guān)于Libratus的商業(yè)計劃,卡內(nèi)基梅隆大學(xué)計算機學(xué)院院長Andrew Moore表示,他自己最喜歡的商業(yè)應(yīng)用是在企業(yè)交易或者是企業(yè)談判領(lǐng)域,貨物的供需或者貨物的交易,可以用這種AI驅(qū)動的商業(yè)談判算法來進(jìn)行,人們甚至可以通過AI去摸清談判對象的底線和談判邏輯。

李開復(fù)也表示,當(dāng)前BAT的AI應(yīng)用,主要是以用戶為主,但人工智能最大的應(yīng)用,應(yīng)該是在企業(yè)層面,比如幫保險公司做到更好的收益和平衡,幫銀行做更好的理財或者是財產(chǎn)配置,幫券商做投資或者智能投顧,幫醫(yī)生看片子比人看的更準(zhǔn)等等,這些機會特別大。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論