如果用兩個(gè)阿爾法狗彼此對(duì)決，勝負(fù)會(huì)如何呢？

pgl147258 2017-09-22

展開(kāi)全文

93贊

踩

網(wǎng)上已經(jīng)公布了阿爾法狗之間對(duì)弈的50盤(pán)棋譜，還有大量的棋譜沒(méi)有公開(kāi)，但僅僅從這50盤(pán)棋來(lái)看，就已經(jīng)是驚世駭俗了。很多招法別說(shuō)我們這個(gè)歲數(shù)的棋手沒(méi)見(jiàn)過(guò)，就是柯潔他們，也不敢說(shuō)見(jiàn)過(guò)吧？實(shí)在太不可理喻了！就像這盤(pán)棋，白10在角上碰了后又跑到下邊盤(pán)碰一下，白12、白14放置一邊又不繼續(xù)了，然后又轉(zhuǎn)到右下角白16扳，如果阿爾法狗是人類的話，很想問(wèn)問(wèn)他，這兩處的著法之間有必然性嗎？如果有必然性，那需要多少個(gè)變化圖講清楚這樣下的內(nèi)在必然性。

我們也相信，阿爾法狗的后臺(tái)程序里肯定已經(jīng)將這兩處變化都算得清清楚楚，人工智能不會(huì)憑感覺(jué)下棋，那是人類之所長(zhǎng)。阿爾法狗的每手棋就基于形勢(shì)判斷和詳細(xì)計(jì)算，因此看似匪夷所思的著法在阿爾法狗那里，應(yīng)該是經(jīng)過(guò)了海量的計(jì)算后，得出的最佳結(jié)論，問(wèn)題是，這樣的實(shí)戰(zhàn)著法估計(jì)就算過(guò)了一百年，人類也沒(méi)法接受。

人類如果能洞悉阿爾法狗下棋的思維模式，那么就能破譯其著法的必然性所在，否則，人類與阿爾法狗之間沒(méi)有勝負(fù)可言，它已經(jīng)破譯了人類的所有思路、著法，而人類卻對(duì)它幾乎一無(wú)所知，據(jù)說(shuō)它還可以不斷地升級(jí)，現(xiàn)在的AlphaGo2.0版要讓2016年AlphaGo1.0版三個(gè)子，這實(shí)在是太可怕了！圍棋竟然如此深?yuàn)W，人工智能竟然如此先進(jìn)。從上邊棋譜來(lái)看，阿爾法狗跟人下的還是圍棋，它們相互之間進(jìn)行的只能說(shuō)是來(lái)自遙遠(yuǎn)未來(lái)的棋局。

162評(píng)論

智能數(shù)碼科技數(shù)碼達(dá)人 05-25 10:22

103贊

踩

其實(shí)，你提的問(wèn)題，本身就是阿爾法狗深度學(xué)習(xí)的秘密！

請(qǐng)仔細(xì)看上圖，AlphaGo通過(guò)自我對(duì)弈，產(chǎn)生一個(gè)輸贏的結(jié)果；然后再以此為基礎(chǔ)，再自我對(duì)弈；一直循環(huán)往反復(fù)。通過(guò)大量的自我對(duì)弈棋局，最終提升預(yù)測(cè)水平，也就是圍棋水平。

人類棋手，窮其一生，對(duì)弈局?jǐn)?shù)最多也只有數(shù)萬(wàn)而已。

但阿爾法狗就不一樣了，通過(guò)分布式電腦的頂尖運(yùn)行速度，它短時(shí)間內(nèi)就可以產(chǎn)生百萬(wàn)甚至千萬(wàn)的自我對(duì)弈局?jǐn)?shù)，并且隨著時(shí)間的增長(zhǎng)，它可以持續(xù)通過(guò)自我對(duì)弈提升自己的水平！

所以，你的問(wèn)題答案就很明白了：

兩個(gè)版本完全一致的阿爾法狗對(duì)弈的話，肯定會(huì)有贏有輸，輸贏會(huì)非常接近！

如果版本不一致的兩個(gè)阿爾法狗對(duì)弈的話，肯定是后期版本的贏的機(jī)率大！這是它深度學(xué)習(xí)的原理決定的！

一句話：你的兩個(gè)阿爾法狗對(duì)弈的問(wèn)題，它其實(shí)已經(jīng)進(jìn)行了上千萬(wàn)甚至上億次了！

44評(píng)論

蕭十一瀾 09-21 22:10

1贊

踩

兩個(gè)阿爾法狗下棋，比一個(gè)人自己拿黑白棋對(duì)下（智力較量），或者左右手互搏（體力較量）都沒(méi)有懸念，即：如果不貼目的話，黑棋必勝。如果貼目的話，就很復(fù)雜了，后面會(huì)提到。

二狗相爭(zhēng)，不貼目執(zhí)黑必勝的道理很簡(jiǎn)單：兩個(gè)一模一樣的智能機(jī)器，每一步棋都經(jīng)過(guò)海量計(jì)算和智能學(xué)習(xí)比對(duì)，因此“不會(huì)犯錯(cuò)”是必須的，既然在“同級(jí)別智能狀態(tài)”下不犯錯(cuò)，那么，先行獲勝豈不是必然事件嗎？

阿爾法狗落子如飛，是其應(yīng)用了新算法中的“走子網(wǎng)絡(luò)”，智能強(qiáng)度與載體的GPU性能息息相關(guān)。懂電腦的人都知道GPU是圖形處理器，主要負(fù)責(zé)圖形計(jì)算。而圖形計(jì)算和普通的CPU數(shù)據(jù)計(jì)算不同，是一種圖形匹配技術(shù)。這是阿爾法狗的一個(gè)技術(shù)關(guān)鍵。

阿爾法狗是進(jìn)行圍棋圖形大數(shù)據(jù)檢索，即調(diào)用自己的圍棋圖形的的數(shù)據(jù)，通過(guò)圖形匹配，找出當(dāng)前圍棋圖形下的近似解，并以勝率進(jìn)行選擇。這個(gè)“當(dāng)前圍棋圖形”，應(yīng)該是基于整個(gè)棋盤(pán)的。阿爾法狗的棋形數(shù)據(jù)庫(kù)應(yīng)該是經(jīng)過(guò)長(zhǎng)時(shí)間深度學(xué)習(xí)后融入其的神經(jīng)網(wǎng)絡(luò)的一部分，相當(dāng)于人的記憶部分。其與人類不同的是，這個(gè)記憶非但不會(huì)磨滅，而且通過(guò)學(xué)習(xí)，對(duì)弈，還在不斷自我增強(qiáng)，爆炸式增強(qiáng)，并且兩狗都一樣，同步增強(qiáng)。

這倒是扯出一個(gè)新問(wèn)題，執(zhí)黑先行的“便宜”到底有多大？這才是決定狗狗誰(shuí)勝誰(shuí)負(fù)的關(guān)鍵：既然技術(shù)無(wú)瑕疵，那么先行的優(yōu)勢(shì)和其應(yīng)該付出的代價(jià)（貼目）就至關(guān)重要了。

不要以為這是廢話，黃龍士，本因坊秀哉，木谷實(shí)，坂田榮男，趙治勛，李昌鎬，李世乭，柯潔等等這些曾經(jīng)各領(lǐng)風(fēng)騷數(shù)百天數(shù)千天的棋壇霸主，甚至，在不貼目時(shí)代的棋圣吳清源，十二歲即嶄露頭角，翌年在國(guó)內(nèi)無(wú)敵手，二十歲創(chuàng)圍棋新布局法，在日期間盡敗日本高手，被譽(yù)為古今第一人的吳清源，也沒(méi)有做到不貼目執(zhí)黑全勝。

歷史上從不貼目（互先），然后貼三目五目半……六目半七目半的都存在過(guò)?，F(xiàn)行的日本韓國(guó)貼六目半，中國(guó)以及臺(tái)灣應(yīng)氏杯等價(jià)于貼七目半。到底多少合適？恐怕沒(méi)人能說(shuō)清！

無(wú)論如何，從三十年代到迄今為止的發(fā)展趨勢(shì)，貼目負(fù)擔(dān)是越來(lái)越重。棋盤(pán)空著的時(shí)候一手棋（黑方先手的優(yōu)勢(shì)）的價(jià)值有多少？這在職業(yè)棋手中也眾說(shuō)紛紜。陳祖德評(píng)棋，認(rèn)為一手棋有十目?jī)r(jià)值；而沈果孫七段則認(rèn)為有貼目的二倍也即是十五目左右，當(dāng)然還有各種各樣更小更大的說(shuō)法……有趣的是，貼目規(guī)則的原理是先手優(yōu)勢(shì)。但是貼目多少的指定更多的是大數(shù)據(jù)下的統(tǒng)計(jì)勝率，而非像理論家這樣去想先手價(jià)值與次一手的價(jià)值差。

只有明確了這個(gè)貼目的最合理數(shù)字，才能真正知道一盤(pán)棋定勝負(fù)的“二狗相爭(zhēng)”是誰(shuí)能笑到最后，這個(gè)真的真的很關(guān)鍵。

“想一萬(wàn)年也不會(huì)想明白啊”……木谷實(shí)語(yǔ)。

2評(píng)論

NovemberChopin 05-26 02:47

99贊

踩

據(jù)說(shuō)阿爾法狗學(xué)習(xí)能力，推演能力都很強(qiáng)，而且更要命的就是理論上計(jì)算機(jī)不會(huì)犯錯(cuò)誤！?。。。∵@個(gè)好像就是破壞游戲規(guī)則嘛………但是兩只狗狗??一起對(duì)戰(zhàn)，一起互相學(xué)習(xí)，一起不犯錯(cuò)的話，我覺(jué)得…………………………………！……………………………………………………………………………………電量大的那只能贏?。。?！因?yàn)榘柗ü泛孟窈苜M(fèi)電?。。?！每落下一顆棋子據(jù)說(shuō)電費(fèi)3000美元?。。∷浴娏看蟮哪侵荒苴A…………??

34評(píng)論

名煬股份 3小時(shí)前

6贊

踩

圍棋與其說(shuō)計(jì)算得出最優(yōu)解，還不如說(shuō)是在眾多選擇中排除惡手。水平高的就能正確地排除更多的錯(cuò)誤選擇。誰(shuí)的效率更好，誰(shuí)的準(zhǔn)確度越好，誰(shuí)的勝率就越大。

面對(duì)一個(gè)局面，外行、愛(ài)好者和初入門(mén)新手可能只能排除一部門(mén)選擇，留下十幾種深入思考，而九段高手可能非常熟練地用更短的時(shí)間就留下兩三種變化進(jìn)而分析。這就能解釋為什么剛?cè)攵蔚男∨笥褳槭裁慈齼刹綌[定式就能把十多年野棋經(jīng)驗(yàn)的業(yè)務(wù)選手弄得手足無(wú)措。也能解釋為什么大高手錯(cuò)算一步就導(dǎo)致大龍?jiān)馔馈?/p>

再進(jìn)一步，我認(rèn)為人工智能的優(yōu)勢(shì)有兩個(gè)。一是計(jì)算深度。這個(gè)不用過(guò)多解釋。在明確規(guī)則限制下，計(jì)算機(jī)可以快速演算模擬接近于窮盡的所有變化。再輔以選擇策略，可以大幅提升效率和準(zhǔn)確度?？鋸埖卣f(shuō)，人工智能可以用普通人一生的精力去計(jì)算一步棋，人是做不到的。二是人工智能幾乎不受情緒波動(dòng)的干擾。勝不驕敗不餒。不會(huì)因?yàn)橐惶幍檬Ф绊懞罄m(xù)行棋。不會(huì)因?yàn)榍耙惶旌团匀藸?zhēng)執(zhí)而影響現(xiàn)在的對(duì)局。更不會(huì)因?yàn)樾愿穸a(chǎn)生愛(ài)殺伐或者愛(ài)造勢(shì)的棋路派別。簡(jiǎn)而言之就是務(wù)實(shí)到可怕。

最后就是總結(jié)，我感覺(jué)兩個(gè)完全一樣的程序在運(yùn)算，結(jié)果必然是一樣的。但畢竟有先后手的區(qū)別，所以每一步面對(duì)的實(shí)際上是不同的局面。因此，影響結(jié)局的會(huì)是規(guī)則。也就是讓子數(shù)量會(huì)影響判斷依據(jù)?，F(xiàn)在的讓子標(biāo)準(zhǔn)也是估算出來(lái)的，是否準(zhǔn)確有待商榷。

引申一下，是否可以考慮讓人工智能海量對(duì)戰(zhàn)，調(diào)整讓子標(biāo)準(zhǔn)。讓勝負(fù)更加客觀公正。

2評(píng)論

我要魚(yú)牛肉面面 05-25 06:52

6贊

踩

謝邀。我覺(jué)得這個(gè)問(wèn)題有點(diǎn)無(wú)聊。因?yàn)榭聺嵟c阿爾法狗大戰(zhàn)，包括以前阿爾法狗同韓國(guó)李世石大戰(zhàn)，目的都是為了檢驗(yàn)人工智能與人類棋手的水平高低，如果換成兩個(gè)阿爾法狗對(duì)戰(zhàn)，不論輸贏抑或打平，那都毫無(wú)意義，不能說(shuō)明人工智能超過(guò)人類。舉辦阿爾法狗與世界頂尖圍棋手大賽，目的是為了更好研發(fā)人工智能服務(wù)的。

13評(píng)論

物聯(lián)科技 05-27 15:46

7贊

踩

兩個(gè)阿爾法狗彼此對(duì)決，雙方剛開(kāi)始分別知道對(duì)方是怎么運(yùn)算的，那么A每下一步棋，都會(huì)推演B怎么下，然后開(kāi)始設(shè)計(jì)各種陰謀詭計(jì)。

同時(shí)B也會(huì)這么干。

經(jīng)過(guò)無(wú)數(shù)次對(duì)弈之后，阿爾法go-A和B會(huì)成為我們都不認(rèn)識(shí)的集所有陰謀詭計(jì)之大全的超級(jí)智能機(jī)器人，從甩李世石十條街，變成甩1000000000條街。這種“狗”以后會(huì)把我們虐哭。

而且因?yàn)?，機(jī)器學(xué)習(xí)也有隨機(jī)性，優(yōu)勢(shì)會(huì)積累放大，一年之后，阿爾法go-A或B會(huì)變得實(shí)力懸殊，一年后，兩者的對(duì)弈狀態(tài)是，要么是A一直碾壓B，要么是B一直碾壓A。

評(píng)論

逗樂(lè)兒了嗨 05-25 11:02

7贊

踩

謝謝邀請(qǐng)！對(duì)圍棋了解不多，但對(duì)這件事兒還是有所了解，一方面說(shuō)明了人工智能在某些方面要強(qiáng)于人腦，另一方面，人腦思考能力還是有局限性，而人工智能會(huì)因人類科技的發(fā)展越來(lái)越強(qiáng)！

如您所說(shuō)，如果是兩個(gè)機(jī)器人比，我感覺(jué)會(huì)不相上下，打成平局，畢竟人工智能是人創(chuàng)造出來(lái)的，各種程序也是由人設(shè)計(jì)的。但這種可比性我感覺(jué)毫無(wú)意義，結(jié)果也證明不了什么，只能是看看稀罕！

依您提出的問(wèn)題，我想反問(wèn)一下：人工智能越來(lái)越進(jìn)步的同時(shí)人類會(huì)不會(huì)退化？

2評(píng)論

風(fēng)中CD 05-25 17:12

5贊

踩

狗狗本來(lái)就是這么下棋的，它的學(xué)習(xí)就是自我對(duì)弈，包括在比賽時(shí)，它的每一步用時(shí)也是都花在自我對(duì)弈上，它在每一步的用時(shí)中已經(jīng)不知道下了多少盤(pán)自我對(duì)弈了，并且從中選出一個(gè)勝率最高的落子。

所以兩個(gè)一樣的狗對(duì)弈，如果基礎(chǔ)條件相同，即自我學(xué)習(xí)的時(shí)間相同，那么他們的勝負(fù)應(yīng)該是各半的。其實(shí)真正有意義的是不同的狗之間在同樣的學(xué)習(xí)時(shí)間后對(duì)弈，可以看不同算法的優(yōu)劣。

評(píng)論

亭前垂柳 05-30 08:37

1贊

踩

兩個(gè)阿法狗彼此對(duì)決的棋譜已經(jīng)公開(kāi)了五十局，在deepmind的網(wǎng)站可以下載，黑棋貼七目半的負(fù)擔(dān)略重，白棋的勝率較高一點(diǎn)點(diǎn)。從阿法狗的自我對(duì)決的招法來(lái)看，如果說(shuō)人類棋手的戰(zhàn)斗是一場(chǎng)平面戰(zhàn)爭(zhēng)，那么阿法狗的戰(zhàn)斗就是一場(chǎng)海陸空全方位的立體戰(zhàn)爭(zhēng)。我認(rèn)為阿法狗比人類最強(qiáng)的棋手也要高出兩子。假如谷歌公司繼續(xù)提升算法，阿法狗會(huì)變得更強(qiáng)，將無(wú)限接近于圍棋上帝。

評(píng)論

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自： pgl147258 > 《為什么 ? 頭》

舉報(bào)/認(rèn)領(lǐng)