今天,大家都在興奮地傳播著一條消息:谷歌AI在圍棋上戰(zhàn)勝了歐洲冠軍。興奮的理由是,人工智能在被定義為最難攻克的圍棋上戰(zhàn)勝人類職業(yè)棋手。人類與AI之間的最后一堵防護(hù)墻,正在一點(diǎn)一點(diǎn)坍塌。 谷歌使用的人工智能軟件是AlphaGo,由谷歌去年收購(gòu)的人工智能公司DeepMind研發(fā),其中兩個(gè)神經(jīng)網(wǎng)絡(luò)有著關(guān)鍵的作用,一個(gè)叫決策網(wǎng)絡(luò)(policy network),負(fù)責(zé)選擇下一步走法,另一個(gè)叫值網(wǎng)絡(luò)(value network),負(fù)責(zé)預(yù)測(cè)棋盤(pán)上不同的分布會(huì)帶來(lái)什么不同的結(jié)果。 此次AlphaGo戰(zhàn)勝的是歐洲圍棋冠軍樊麾(法國(guó)國(guó)家圍棋隊(duì)總教練),AlphaGo以5-0完勝。但AlphaGo真正的挑戰(zhàn)是2個(gè)月后,與韓國(guó)圍棋九段高手李世石的對(duì)弈。而樊麾雖為歐洲圍棋冠軍,但實(shí)際上也僅為二段水平。高手與頂級(jí)高手之前也存在很大差距,不知道在AlphaGo與李世石之間,隔了多少個(gè)樊麾。此前圍棋軟件ZEN、Crazystone都戰(zhàn)勝過(guò)九段圍棋高手,不過(guò)都是在對(duì)方讓子的前提下。 樊麾與AlphaGo的對(duì)弈棋譜,黑方為樊麾,白方為AlphaGo 圍棋到底有多難?在19×19的棋盤(pán)內(nèi),共有361個(gè)點(diǎn),就機(jī)器學(xué)習(xí)的角度而言,圍棋的計(jì)算最大有3361次方種局面,大致的體量是10170,而已經(jīng)觀測(cè)到的宇宙中,原子的數(shù)量才1080。而相較之下,國(guó)際象棋每一步平均只有35種可能性的走法,最多只有2155種局面。 如此大的計(jì)算量無(wú)疑是對(duì)人工智能的一大挑戰(zhàn),但實(shí)際上,人工智能是與人類一樣,通過(guò)不斷模仿而戰(zhàn)勝對(duì)手的。一個(gè)圍棋愛(ài)好者向雷鋒網(wǎng)記者表示,人工智能其實(shí)是一個(gè)模仿高手,通過(guò)記住大量高手在以往對(duì)弈中的棋譜,并不斷練習(xí),從而研究出新的招數(shù)。
除了需要記住大量棋譜,人工智能還需要一個(gè)高手來(lái)讓自己不斷提高。ZEN早年就拉上日本一流高手,九段棋手武宮正樹(shù)作為陪練,2012年3月,在武宮正樹(shù)讓五子和四子的前提下,ZEN連勝兩盤(pán)。武宮正樹(shù)“宇宙流”式下棋特點(diǎn),也被ZEN很好地模仿了去。因此,AlphaGo如果想戰(zhàn)勝李世石,最快的方式是找到一個(gè)同水平的高手作為陪練,最好是熟悉李世石下棋特點(diǎn)的人。因?yàn)?,留給它的時(shí)間已經(jīng)不多了。 李世石 對(duì)于人類來(lái)說(shuō),因天分和后天努力程度,每個(gè)人提升速度會(huì)不一樣,有人20歲就能躋身世界冠軍,有人窮盡一生也入不了高手榜。但無(wú)論如何,在很多人眼里,圍棋并非一蹴而就。就比如最近引起輿論嘩然的“真瘋叔叔”的“六天速成法”,宣稱可以讓成年人在六天之內(nèi),圍棋水平從零基礎(chǔ)提高到業(yè)余1段,不過(guò)回應(yīng)他的,是來(lái)自圍棋界的各種嘲笑。 六天從零基礎(chǔ)提高到業(yè)余1段,如果放在人工智能身上,或許有這個(gè)可能。不過(guò)想要從職業(yè)二段挑戰(zhàn)職業(yè)九段,贏得可能性并不大。圍棋作為起源于中國(guó)的博弈游戲,在亞洲的流行更加廣泛,在歐美等地區(qū),圍棋的普及度還較低,這也就是為什么會(huì)出現(xiàn)一個(gè)二段棋手成為歐洲冠軍。在這種情況下,AlphaGo很難遇到一個(gè)頂級(jí)高手,也就妄論戰(zhàn)勝頂級(jí)高手了。 不過(guò),圍棋的復(fù)雜度與挑戰(zhàn)難度,令其成為人工智能最想攻克的難題。一個(gè)多月前,DeepMind的CEO Demis Hassabis在一個(gè)視頻采訪中透露,他們的秘密團(tuán)隊(duì)可能將破解圍棋。Hassabis在談到這個(gè)可能時(shí)表現(xiàn)得很興奮,因?yàn)樵谒磥?lái)這是個(gè)了不起的挑戰(zhàn)?!?span style="line-height: 1.8;">它不像國(guó)際圍棋那樣需要蠻力,它實(shí)際上是漂亮的,有規(guī)律可循,有形狀可追的,而這些通常是計(jì)算機(jī)不擅長(zhǎng)的,因此它非常了不起。” 除了谷歌,Facebook也在進(jìn)行AI攻克圍棋的測(cè)試。就在《Nature》報(bào)道了AlphaGo戰(zhàn)勝樊麾的前一天,F(xiàn)acebook也在arXiv.org上更新了一篇用卷積神經(jīng)網(wǎng)絡(luò)和蒙特卡洛樹(shù)搜索相結(jié)合來(lái)解決圍棋問(wèn)題的新論文。Facebook人工智能實(shí)驗(yàn)室負(fù)責(zé)人Yann LeCun在論文中表示,作為一項(xiàng)非常困難的任務(wù),圍棋是一個(gè)很好的案例來(lái)驗(yàn)證各種學(xué)習(xí)技能的結(jié)合,包括模式識(shí)別、問(wèn)題解決和規(guī)劃等,也是一個(gè)可以用來(lái)測(cè)試新想法的工具,包括機(jī)器學(xué)習(xí)、推理和規(guī)劃的結(jié)合。因此,戰(zhàn)勝圍棋高手,不僅僅是一場(chǎng)游戲,更重要的是人工智能的突破。而人工智能對(duì)于人類的影響,將是無(wú)限可能的。 從國(guó)際象棋的經(jīng)驗(yàn)看,1997 年人工智能第一次打敗人類后,直到2006年,人工智能在人類這里再無(wú)對(duì)手。而人工智能想要在圍棋上完全戰(zhàn)勝人類,還需要不斷地練習(xí)。至少這次,贏得可能性很小。 |
|