李世石
縱觀全盤,計算機Alpha Go出現(xiàn)了兩次較小的失誤,最終沒有影響大局;而李世石卻犯下了一個重大失誤,直接導致最后丟掉了比賽。
之后的比賽李世石能否捍衛(wèi)人類尊嚴?這臺在第一盤擊敗了韓國棋王李世石的Alpha Go到底是一臺怎樣的超級計算機?
據(jù)谷歌旗下DeepMind公司CEO兼谷歌副總裁戴密斯-哈薩比斯透露,DeepMind為AlphaGo輸入了海量的職業(yè)棋手對局,其自我演繹的對局數(shù)更是達到了3000萬局,相當于人類1000年的學習量。
Alpha Go的核心是兩種不同的深度神經(jīng)網(wǎng)絡——“策略網(wǎng)絡”(Policy network)和“價值網(wǎng)絡”(Value network)。
“策略網(wǎng)絡”負責減少搜索寬度,排除明顯錯誤的著法;“值網(wǎng)絡”負責減少搜索深度,通過對局勢的判斷,在明顯劣勢下果斷拋棄某些路線,不用每條道算到黑。
通過這兩個網(wǎng)絡分析局面,Alpha Go會更像一個人類棋手,通過對當前局面的判斷和對未來局面的推演,根據(jù)不同權(quán)重,在函數(shù)中算出一種贏的概率最高的著法。
看到這里不少對于人工智能不甚了解的文科生可能已經(jīng)暈了——什么策略、價值,什么寬度、深度,光是這么解釋完全抓不到要點!說到底這Alpha Go和十多年前的深藍相比有哪些突破性的進步?這人工智能下圍棋到底又比下象棋難在哪?且聽小編來給你講講人話。
為什么計算機挑戰(zhàn)國際象棋10多年前就成功,圍棋卻不行?
國際象棋每回合有35種可能,一盤象棋可達80回合,在計算方面,國際象棋最多會有10的47次方局面;而圍棋每回合有250種可能,一盤棋可長達150回
合。對于一個19x19的圍棋棋盤而言,一共有361個位置,而每個位置可以單獨放置黑棋、白棋或者留空,理論上所有的可能組合是3^361種,其合法的
組合超過170位數(shù)。
170位數(shù)是什么概念呢?如果有這個數(shù)量級的水分子,將足以填滿整個宇宙!
在十多年前,深藍在國際象棋上戰(zhàn)勝了當時的國際象棋棋王卡斯帕羅夫,其原理其實是讓人工智能在計算上窮盡了所有的可能,但如果挑戰(zhàn)項目換成圍棋,170位數(shù)的可能性,無論在當時還是現(xiàn)在,都遠遠超過了計算機的計算能力。
因此,在Alpha Go每下一步圍棋的時候,并不能計算盡所有的可能性下一招“必勝之棋”,而是通過上面提到的“策略網(wǎng)絡”和“價值網(wǎng)絡”的分析,做出一種獲勝概率更高的選擇。
這種從深藍到Alpha Go的深度神經(jīng)網(wǎng)絡運用的變化,恰恰使得Alpha Go的運行方式更像人類——也就是說要進行“取舍”。
另外,除了深度神經(jīng)網(wǎng)絡算法之外,Alpha Go還通過蒙特卡羅樹搜索吸收以往棋局的經(jīng)驗,同時另一邊進行著自我對局。
蒙特卡羅樹搜索是把預測走棋、采樣走棋、提升速度、預測局面 的各部分連起來,組成了一個完整的系統(tǒng)。
下面這個是國際象棋的。
國際象棋蒙特卡洛樹
這個是圍棋的。
圍棋蒙特卡洛樹
同樣,這種從局部到整體,對知識進行分層的結(jié)構(gòu)計算方式與之前相比更加統(tǒng)一,從人類思維的角度來看,其獲得的知識也就更接近圍棋的本質(zhì)。這也就是為什么圈內(nèi)人士都認為,如果人工智能能夠在圍棋上戰(zhàn)勝人類,將代表人工智能進入了一個新階段。
最后,這個內(nèi)行看門道,外行就湊個熱鬧。講道理的話,小編其實還是支持我們的人類代表李世石的。
(看看新聞網(wǎng)記者:楊城)
劍網(wǎng)行動舉報電話:12318(市文化執(zhí)法總隊)、021-64334547(市版權(quán)局)
Copyright ? 2016 Kankanews.com Inc. All Rights Reserved. 看東方(上海)傳媒有限公司 版權(quán)所有