午夜一级黄片毛片,九九99久久精品午夜剧场免费

人工智能下圍棋不需要人類對手了人類只是觀眾

2018-08-16 03:41

快資訊

王子凱

馬博從未下過一盤完整的圍棋，但他的“作品”很會下棋。最近，在一場世界級的圍棋大賽中，“絕藝”以7∶0戰(zhàn)勝“星陣”獲得冠軍，倆選手都不是人。絕藝來自馬博所在的騰訊AI團(tuán)隊，...

馬博從未下過一盤完整的圍棋，但他的“作品”很會下棋。

最近，在一場世界級的圍棋大賽中，“絕藝”以7∶0戰(zhàn)勝“星陣”獲得冠軍，倆選手都不是人。絕藝來自馬博所在的騰訊AI團(tuán)隊，星陣的前身是清華大學(xué)開發(fā)的“神算子”。

參加本屆騰訊世界人工智能圍棋大賽前，絕藝曾對陣柯潔豪取13連勝，還以11連勝的戰(zhàn)績奪得第10屆UEC杯計算機(jī)圍棋大賽冠軍，成為這項承載“攻克圍棋”使命的AI賽事里最后一個冠軍。它的名字來自杜牧詩句“絕藝如君天下少，閑人似我世間無”。

比起UEC杯，騰訊舉辦的人工智能圍棋大賽參賽門檻更高：參賽程序需要獲得過世界人工智能圍棋比賽（最近3年）前8名的成績，或棋力在騰訊野狐圍棋平臺九段及以上。大賽吸引了包括日韓兩國國家圍棋隊指定訓(xùn)練AI在內(nèi)的眾多高手，一度被外界認(rèn)為是一場“眾神之戰(zhàn)”。

人類世界的圍棋高手只是觀眾

2016年3月以來，在騰訊程序員馬博的工作計算機(jī)里，絕藝幾乎24小時都在跟自己下棋，每天對弈成千上萬盤。

這樣的對局?jǐn)?shù)，是人類棋手一生幾萬盤棋難以企及的。而在19×19的方格世界中，存在著10171種有效對局盤，數(shù)量超過宇宙原子的總和。

兩年前，李世石以1∶4敗給阿爾法狗，后者的訓(xùn)練數(shù)據(jù)是3000萬盤棋。人類不再心存“贏”的幻想。此后阿爾法狗又連勝中日韓高手60盤，其技藝“讓人類棋手感到絕望”。

兩周前，眾多圍棋國手來到他們熟悉的中國棋院對弈場，只當(dāng)觀眾。馬博和絕藝研發(fā)團(tuán)隊第一次走進(jìn)中國圍棋最高殿堂：“棋圣”聶衛(wèi)平、“八冠王”古力、“天才少年”柯潔都曾在此留下名局。

AI棋手沒有環(huán)肥燕瘦或迥異個性，它們不像聶衛(wèi)平那樣嗜煙如命，在煙霧繚繞中陷入棋局的沉思。也不會有柯潔的年少輕狂，對陣前輩李世石前放話“勝算95%”。它們是一行行代碼和后臺的計算資源，人類棋手要緊跟棋盤局勢都顯得十分吃力。

“比賽現(xiàn)場觀眾都是一些職業(yè)棋手。”馬博對中國青年報·中青在線回憶，他將筆記本電腦接入比賽的對弈系統(tǒng)，點擊屏幕上的“開始”后，就“與我無關(guān)”了，人類棋手則緊盯著對弈臺后面的電子棋盤。雖然人類前輩在幾千年前就已經(jīng)開始黑白“搏殺”，并且一直是勝負(fù)的主角，但此刻的棋盤上還是有太多人類從未見過的“殺招”。

“我們和AI的思考層級不同，在計算量上存在著差距。”作為決賽解說嘉賓的古力表示，他曾和絕藝有過數(shù)次交手，但對手成長之快，他始料未及。3年前，風(fēng)頭正盛的日本圍棋AI“DeepZenGo”開發(fā)者加藤英樹曾表示，人工智能攻克圍棋至少需要10年。

我們是人類，人類會犯錯誤

兩年前的絕藝還只是業(yè)余五段的水平，如今古力已用“不可思議”來解說昔日對手的戰(zhàn)術(shù)了。就在4個月前，古力在個人微博上曬出“絕藝正式成為中國國家圍棋隊訓(xùn)練專用AI”畫面，并配文“國家隊的訓(xùn)練方式跟上了時代步伐”，而此前的中國國家隊并沒有專用AI。

在賽場上，馬博偶爾也會聽聽解說嘉賓聊起的圍棋段子，或是走下對弈臺喝喝茶，和羅洗河聊聊天——后者是絕藝的圍棋顧問，也是開發(fā)團(tuán)隊中唯一能下完一盤圍棋的人。這位曾在2006年1月終結(jié)“李昌鎬時代”的傳奇棋士，也是截至目前和絕藝對弈最多次的人類。他需要通過與之對弈發(fā)現(xiàn)漏洞，將它打造成“圍棋上帝”。

比起棋盤走勢，馬博和他的對手更關(guān)心各自電腦屏幕上閃現(xiàn)出來的一行行勝率計算結(jié)果，那是AI通過算法分析落子位置得出的獲勝概率。屏幕上勝率持續(xù)上升，意味著此前的算法分析沒有出現(xiàn)失誤，布局意圖正逐步實現(xiàn)。但隨著對手落下一顆棋子，局面的勝率就會被算法重新統(tǒng)計。

絕藝使用的算法框架并非馬博團(tuán)隊的首創(chuàng)。“人工智能領(lǐng)域有很多公開的算法框架，按照這些框架很快就能做出產(chǎn)品。但如果要達(dá)到更高的勝率，就要在算法細(xì)節(jié)和計算能力上努力了。”雖然馬博為絕藝寫下了第一行代碼，但其核心算法框架來自于DeepMind團(tuán)隊。

2016年1月28日，谷歌旗下的DeepMind團(tuán)隊在《自然》雜志發(fā)表論文，介紹了阿爾法狗程序的技術(shù)細(xì)節(jié)，還附帶它以5∶0橫掃三屆歐洲圍棋冠軍樊麾二段的喜訊。

樊麾并沒有像1997年國際象棋世界冠軍卡斯帕羅夫那樣，在被IBM研發(fā)的象棋AI“深藍(lán)”擊敗以后，指責(zé)這款電腦程序作弊，并要求重新比賽。他也并沒有像這位俄羅斯棋王一樣，有過3次擊敗“棋桌對面新型智慧”的戰(zhàn)績，并坦言“自己還有幾年的安穩(wěn)日子”。面對比國際象棋10120種變化更為復(fù)雜的圍棋，樊麾的劣勢要更加明顯。

“人類是會犯錯誤的，因為我們是人類。”阿爾法狗在樊麾眼里像一面沒有任何情緒波動的墻，穩(wěn)穩(wěn)地堵住了他調(diào)動的一切經(jīng)驗和智力攻勢，也壓住了一名頂尖棋手求勝的欲望。如果沒有事先告訴他阿爾法狗是程序的話，樊麾甚至?xí)J(rèn)為對方是一個棋路清奇的人類棋手。

一年后的烏鎮(zhèn)棋局，阿爾法狗又以3∶0的戰(zhàn)績強勢逼哭了棋盤對面的柯潔，這位圍棋史上最年輕的五冠王第一次在賽場上失控落淚。在離開對弈臺的20分鐘里，他覺得自己就像一個“無助的孩子”，對過程和結(jié)局都感到絕望。

“對手非常完美，沒有任何缺陷和失誤，而且也沒有任何心態(tài)上的波動。”柯潔賽后曾表示。阿爾法狗也在此戰(zhàn)后成為中國第43位中國圍棋九段獲得者，它的42位九段前輩都是人類。

人工智能下圍棋不需要人類對手了

“沒有情緒”或許是人們對阿爾法狗最為感性的理解了。

實際上，阿爾法狗有著兩個強大的決策網(wǎng)絡(luò)：PolicyNetwork（策略網(wǎng)絡(luò)）和ValueNetwork（價值網(wǎng)絡(luò)）。前者主要判斷在當(dāng)前局面下，下一步棋該怎么走。作出這樣的判斷，不僅需要提前輸入人類已探索出的大量棋譜，還要讓其能夠通過大量的自我對局結(jié)果來學(xué)習(xí)評價每一步棋的優(yōu)劣。后者則相當(dāng)于人類棋手的“大局觀”，阿爾法狗在自我對局中會逐漸學(xué)習(xí)評價整體局面的走勢。

第一個網(wǎng)絡(luò)在從人類棋手已有的走法中篩選出若干種可能的同時，也會通過蒙特卡洛樹搜索來展開這些走法并給出優(yōu)劣判斷。蒙特卡洛樹搜索正是圍棋AI算法的核心之一。在對弈時，它會隨機(jī)選擇一種落子路徑并向下展開，如果這種落子路徑能夠獲勝，就會被賦予一定的權(quán)重，并在下次隨機(jī)選擇路徑時被優(yōu)先選中。

第二個網(wǎng)絡(luò)則會利用整體局面的判斷刪除那些無法得到高勝率的落子路徑，同時也能根據(jù)下一步棋將導(dǎo)致的新局面的優(yōu)劣，給出落子建議。最終的落子決定則是由兩個網(wǎng)絡(luò)被平均加權(quán)后作出的。

這種既有局部判斷又作全盤分析的思考方式已經(jīng)接近人類棋手的思維。雖然棋手選擇的落子位置并非由局部和全盤的思考加權(quán)平均決定，但DeepMind在論文中卻得出了這樣的結(jié)論：兩個大腦取平均的結(jié)果比依賴兩者各自得出的結(jié)果要好很多。

2017年10月，在宣布阿爾法狗退役后的5個月后，DeepMind又在《自然》雜志發(fā)表最新論文。他們最新的“狗”在3天時間內(nèi)積累了490萬盤圍棋賽的訓(xùn)練數(shù)據(jù)，并以100∶0完勝曾經(jīng)打敗過李世石、柯潔等人的——過去的那個自己。此時的阿爾法狗已經(jīng)完全不再需要人類棋手的定式了，所有的訓(xùn)練都是通過自我博弈增強學(xué)習(xí)來完成。

馬博團(tuán)隊先后借鑒了DeepMind兩篇論文，但他們已經(jīng)不再熱衷戰(zhàn)勝人類棋手，以證明絕藝的實力了。很多圍棋界的棋手期待絕藝能逼出阿爾法狗與之一戰(zhàn)，探索圍棋之道的極限。

這樣的眾望，人類曾寄托于吳清源、聶衛(wèi)平、李昌鎬……當(dāng)然，也給過出戰(zhàn)阿爾法狗之前的人類棋手。

THEEND

免責(zé)聲明：凡注明為其它來源的信息均轉(zhuǎn)自其它平臺，由網(wǎng)友自主投稿和發(fā)布、編輯整理上傳，對此類作品本站僅提供交流平臺，不為其版權(quán)負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負(fù)任何法律責(zé)任。若有來源標(biāo)注錯誤或侵犯了您的合法權(quán)益，請作者持權(quán)屬證明與本站聯(lián)系，我們將及時更正、刪除，謝謝。聯(lián)系郵箱：xiali@infoobs.com

本月熱門

精選文章

熱點資訊

電商引流拓客，小程序是主流方向

人工智能下圍棋不需要人類對手了人類只是觀眾

2024 信息化觀察網(wǎng)

長按掃描二維碼閱讀原文

人工智能下圍棋不需要人類對手了人類只是觀眾

最新評論（評論僅代表用戶觀點）

AI沒有“靈魂”

用“芯”提升機(jī)器人性能，掃地機(jī)器人有望提高滲透率

人工智能使元宇宙規(guī)則變得更加重要

調(diào)查顯示，中國生成式人工智能普及率領(lǐng)跑全球

本月熱門

AI 原生時代，字節(jié)想要復(fù)刻第三次增長奇跡

2024 年預(yù)防網(wǎng)絡(luò)攻擊的 12 項網(wǎng)絡(luò)安全最佳實踐措施

2024年上半年中國云終端市場跟蹤報告：出貨量達(dá)到166.3萬臺，同比增長22.4%

從5G到6G：開啟無線通信的未來

DevSecOps建設(shè)標(biāo)桿丨民生證券攜手懸鏡安全，共建敏捷安全開發(fā)體系

權(quán)威解答+圖解 | 《工業(yè)和信息化領(lǐng)域數(shù)據(jù)安全事件應(yīng)急預(yù)案（試行）》

精選文章

采云圓桌會|經(jīng)濟(jì)下一程，政府采購商家如何創(chuàng)新增長？

“用芯編碼 · 智構(gòu)視界”——2023第六屆中國信息技術(shù)應(yīng)用大會智能視頻編碼行業(yè)專題論壇即將開幕!!

連接無界智賦未來|融云2023政企數(shù)智辦公新品巡展3月9日臻美呈現(xiàn)

三維天地解決方案入選工信部2022年制造業(yè)供應(yīng)鏈質(zhì)量管理數(shù)字化解決方案優(yōu)秀案例名單

2019省級政務(wù)安全研討會在湖北拉開帷幕

王欽敏：數(shù)治安全智理未來

熱點資訊

DevSecOps建設(shè)標(biāo)桿丨民生證券攜手懸鏡安全，共建敏捷安全開發(fā)體系

ESIS 2024第三屆中國電子半導(dǎo)體數(shù)智峰會正式啟動，邀您共創(chuàng)電子半導(dǎo)體行業(yè)美好未來!

榮耀應(yīng)用市場攜手?jǐn)?shù)智融合應(yīng)用伙伴共創(chuàng)綠色生態(tài)

“皇冠丹麥曲奇”勝訴 “藍(lán)罐曲奇”敗訴——市場競爭需遵守法律底線

什么是 OSI 模型？OSI 模型的七層是哪些？

電商引流拓客，小程序是主流方向

互聯(lián)網(wǎng)與機(jī)床行業(yè)相融合，讓機(jī)床更加智能化

人工智能下圍棋不需要人類對手了 人類只是觀眾

最新評論（評論僅代表用戶觀點）

欄目推薦

AI沒有“靈魂”

用“芯”提升機(jī)器人性能，掃地機(jī)器人有望提高滲透率

人工智能使元宇宙規(guī)則變得更加重要

調(diào)查顯示，中國生成式人工智能普及率領(lǐng)跑全球

本月熱門

精選文章

熱點資訊

電商引流拓客，小程序是主流方向

互聯(lián)網(wǎng)與機(jī)床行業(yè)相融合，讓機(jī)床更加智能化

人工智能下圍棋不需要人類對手了人類只是觀眾

用“芯”提升機(jī)器人性能，掃地機(jī)器人有望提高滲透率

調(diào)查顯示，中國生成式人工智能普及率領(lǐng)跑全球

電商引流拓客，小程序是主流方向