日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

如果用兩個(gè)阿爾法狗彼此對(duì)決,勝負(fù)會(huì)如何呢?

 pgl147258 2017-09-22

網(wǎng)上已經(jīng)公布了阿爾法狗之間對(duì)弈的50盤(pán)棋譜,還有大量的棋譜沒(méi)有公開(kāi),但僅僅從這50盤(pán)棋來(lái)看,就已經(jīng)是驚世駭俗了。很多招法別說(shuō)我們這個(gè)歲數(shù)的棋手沒(méi)見(jiàn)過(guò),就是柯潔他們,也不敢說(shuō)見(jiàn)過(guò)吧?實(shí)在太不可理喻了!就像這盤(pán)棋,白10在角上碰了后又跑到下邊盤(pán)碰一下,白12、白14放置一邊又不繼續(xù)了,然后又轉(zhuǎn)到右下角白16扳,如果阿爾法狗是人類的話,很想問(wèn)問(wèn)他,這兩處的著法之間有必然性嗎?如果有必然性,那需要多少個(gè)變化圖講清楚這樣下的內(nèi)在必然性。

我們也相信,阿爾法狗的后臺(tái)程序里肯定已經(jīng)將這兩處變化都算得清清楚楚,人工智能不會(huì)憑感覺(jué)下棋,那是人類之所長(zhǎng)。阿爾法狗的每手棋就基于形勢(shì)判斷和詳細(xì)計(jì)算,因此看似匪夷所思的著法在阿爾法狗那里,應(yīng)該是經(jīng)過(guò)了海量的計(jì)算后,得出的最佳結(jié)論,問(wèn)題是,這樣的實(shí)戰(zhàn)著法估計(jì)就算過(guò)了一百年,人類也沒(méi)法接受。

人類如果能洞悉阿爾法狗下棋的思維模式,那么就能破譯其著法的必然性所在,否則,人類與阿爾法狗之間沒(méi)有勝負(fù)可言,它已經(jīng)破譯了人類的所有思路、著法,而人類卻對(duì)它幾乎一無(wú)所知,據(jù)說(shuō)它還可以不斷地升級(jí),現(xiàn)在的AlphaGo2.0版要讓2016年AlphaGo1.0版三個(gè)子,這實(shí)在是太可怕了!圍棋竟然如此深?yuàn)W,人工智能竟然如此先進(jìn)。從上邊棋譜來(lái)看,阿爾法狗跟人下的還是圍棋,它們相互之間進(jìn)行的只能說(shuō)是來(lái)自遙遠(yuǎn)未來(lái)的棋局。

其實(shí),你提的問(wèn)題,本身就是阿爾法狗深度學(xué)習(xí)的秘密!

請(qǐng)仔細(xì)看上圖,AlphaGo通過(guò)自我對(duì)弈,產(chǎn)生一個(gè)輸贏的結(jié)果;然后再以此為基礎(chǔ),再自我對(duì)弈;一直循環(huán)往反復(fù)。通過(guò)大量的自我對(duì)弈棋局,最終提升預(yù)測(cè)水平,也就是圍棋水平。

人類棋手,窮其一生,對(duì)弈局?jǐn)?shù)最多也只有數(shù)萬(wàn)而已。

但阿爾法狗就不一樣了,通過(guò)分布式電腦的頂尖運(yùn)行速度,它短時(shí)間內(nèi)就可以產(chǎn)生百萬(wàn)甚至千萬(wàn)的自我對(duì)弈局?jǐn)?shù),并且隨著時(shí)間的增長(zhǎng),它可以持續(xù)通過(guò)自我對(duì)弈提升自己的水平!

所以,你的問(wèn)題答案就很明白了:

兩個(gè)版本完全一致的阿爾法狗對(duì)弈的話,肯定會(huì)有贏有輸,輸贏會(huì)非常接近!

如果版本不一致的兩個(gè)阿爾法狗對(duì)弈的話,肯定是后期版本的贏的機(jī)率大!這是它深度學(xué)習(xí)的原理決定的!

一句話:你的兩個(gè)阿爾法狗對(duì)弈的問(wèn)題,它其實(shí)已經(jīng)進(jìn)行了上千萬(wàn)甚至上億次了!

兩個(gè)阿爾法狗下棋,比一個(gè)人自己拿黑白棋對(duì)下(智力較量),或者左右手互搏(體力較量)都沒(méi)有懸念,即:如果不貼目的話,黑棋必勝。如果貼目的話,就很復(fù)雜了,后面會(huì)提到 。

二狗相爭(zhēng),不貼目執(zhí)黑必勝的道理很簡(jiǎn)單:兩個(gè)一模一樣的智能機(jī)器,每一步棋都經(jīng)過(guò)海量計(jì)算和智能學(xué)習(xí)比對(duì),因此“不會(huì)犯錯(cuò)”是必須的,既然在“同級(jí)別智能狀態(tài)”下不犯錯(cuò),那么,先行獲勝豈不是必然事件嗎?

阿爾法狗落子如飛,是其應(yīng)用了新算法中的“走子網(wǎng)絡(luò)”,智能強(qiáng)度與載體的GPU性能息息相關(guān)。懂電腦的人都知道GPU是圖形處理器,主要負(fù)責(zé)圖形計(jì)算。而圖形計(jì)算和普通的CPU數(shù)據(jù)計(jì)算不同,是一種圖形匹配技術(shù)。這是阿爾法狗的一個(gè)技術(shù)關(guān)鍵。

阿爾法狗是進(jìn)行圍棋圖形大數(shù)據(jù)檢索,即調(diào)用自己的圍棋圖形的的數(shù)據(jù),通過(guò)圖形匹配,找出當(dāng)前圍棋圖形下的近似解,并以勝率進(jìn)行選擇。這個(gè)“當(dāng)前圍棋圖形”,應(yīng)該是基于整個(gè)棋盤(pán)的。阿爾法狗的棋形數(shù)據(jù)庫(kù)應(yīng)該是經(jīng)過(guò)長(zhǎng)時(shí)間深度學(xué)習(xí)后融入其的神經(jīng)網(wǎng)絡(luò)的一部分,相當(dāng)于人的記憶部分。其與人類不同的是,這個(gè)記憶非但不會(huì)磨滅,而且通過(guò)學(xué)習(xí),對(duì)弈,還在不斷自我增強(qiáng),爆炸式增強(qiáng),并且兩狗都一樣,同步增強(qiáng)。

這倒是扯出一個(gè)新問(wèn)題,執(zhí)黑先行的“便宜”到底有多大?這才是決定狗狗誰(shuí)勝誰(shuí)負(fù)的關(guān)鍵:既然技術(shù)無(wú)瑕疵,那么先行的優(yōu)勢(shì)和其應(yīng)該付出的代價(jià)(貼目)就至關(guān)重要了。

不要以為這是廢話,黃龍士,本因坊秀哉,木谷實(shí),坂田榮男,趙治勛,李昌鎬,李世乭,柯潔等等這些曾經(jīng)各領(lǐng)風(fēng)騷數(shù)百天數(shù)千天的棋壇霸主,甚至,在不貼目時(shí)代的棋圣吳清源,十二歲即嶄露頭角,翌年在國(guó)內(nèi)無(wú)敵手,二十歲創(chuàng)圍棋新布局法,在日期間盡敗日本高手,被譽(yù)為古今第一人的吳清源,也沒(méi)有做到不貼目執(zhí)黑全勝。

歷史上從不貼目(互先),然后貼三目五目半……六目半七目半的都存在過(guò)?,F(xiàn)行的日本韓國(guó)貼六目半,中國(guó)以及臺(tái)灣應(yīng)氏杯等價(jià)于貼七目半。到底多少合適?恐怕沒(méi)人能說(shuō)清!

無(wú)論如何,從三十年代到迄今為止的發(fā)展趨勢(shì),貼目負(fù)擔(dān)是越來(lái)越重。棋盤(pán)空著的時(shí)候一手棋(黑方先手的優(yōu)勢(shì))的價(jià)值有多少?這在職業(yè)棋手中也眾說(shuō)紛紜。陳祖德評(píng)棋,認(rèn)為一手棋有十目?jī)r(jià)值;而沈果孫七段則認(rèn)為有貼目的二倍也即是十五目左右,當(dāng)然還有各種各樣更小更大的說(shuō)法……有趣的是,貼目規(guī)則的原理是先手優(yōu)勢(shì)。但是貼目多少的指定更多的是大數(shù)據(jù)下的統(tǒng)計(jì)勝率,而非像理論家這樣去想先手價(jià)值與次一手的價(jià)值差。

只有明確了這個(gè)貼目的最合理數(shù)字,才能真正知道一盤(pán)棋定勝負(fù)的“二狗相爭(zhēng)”是誰(shuí)能笑到最后,這個(gè)真的真的很關(guān)鍵。

“想一萬(wàn)年也不會(huì)想明白啊”……木谷實(shí)語(yǔ)。

據(jù)說(shuō)阿爾法狗學(xué)習(xí)能力,推演能力都很強(qiáng),而且更要命的就是理論上計(jì)算機(jī)不會(huì)犯錯(cuò)誤!?。。。∵@個(gè)好像就是破壞游戲規(guī)則嘛………但是兩只狗狗??一起對(duì)戰(zhàn),一起互相學(xué)習(xí),一起不犯錯(cuò)的話,我覺(jué)得…………………………………!……………………………………………………………………………………電量大的那只能贏?。。?!因?yàn)榘柗ü泛孟窈苜M(fèi)電?。。?!每落下一顆棋子據(jù)說(shuō)電費(fèi)3000美元?。。∷浴娏看蟮哪侵荒苴A…………??



圍棋與其說(shuō)計(jì)算得出最優(yōu)解,還不如說(shuō)是在眾多選擇中排除惡手。水平高的就能正確地排除更多的錯(cuò)誤選擇。誰(shuí)的效率更好,誰(shuí)的準(zhǔn)確度越好,誰(shuí)的勝率就越大。

面對(duì)一個(gè)局面,外行、愛(ài)好者和初入門(mén)新手可能只能排除一部門(mén)選擇,留下十幾種深入思考,而九段高手可能非常熟練地用更短的時(shí)間就留下兩三種變化進(jìn)而分析。這就能解釋為什么剛?cè)攵蔚男∨笥褳槭裁慈齼刹綌[定式就能把十多年野棋經(jīng)驗(yàn)的業(yè)務(wù)選手弄得手足無(wú)措。也能解釋為什么大高手錯(cuò)算一步就導(dǎo)致大龍?jiān)馔馈?/p>

再進(jìn)一步,我認(rèn)為人工智能的優(yōu)勢(shì)有兩個(gè)。一是計(jì)算深度。這個(gè)不用過(guò)多解釋。在明確規(guī)則限制下,計(jì)算機(jī)可以快速演算模擬接近于窮盡的所有變化。再輔以選擇策略,可以大幅提升效率和準(zhǔn)確度??鋸埖卣f(shuō),人工智能可以用普通人一生的精力去計(jì)算一步棋,人是做不到的。二是人工智能幾乎不受情緒波動(dòng)的干擾。勝不驕敗不餒。不會(huì)因?yàn)橐惶幍檬Ф绊懞罄m(xù)行棋。不會(huì)因?yàn)榍耙惶旌团匀藸?zhēng)執(zhí)而影響現(xiàn)在的對(duì)局。更不會(huì)因?yàn)樾愿穸a(chǎn)生愛(ài)殺伐或者愛(ài)造勢(shì)的棋路派別。簡(jiǎn)而言之就是務(wù)實(shí)到可怕。

最后就是總結(jié),我感覺(jué)兩個(gè)完全一樣的程序在運(yùn)算,結(jié)果必然是一樣的。但畢竟有先后手的區(qū)別,所以每一步面對(duì)的實(shí)際上是不同的局面。因此,影響結(jié)局的會(huì)是規(guī)則。也就是讓子數(shù)量會(huì)影響判斷依據(jù)?,F(xiàn)在的讓子標(biāo)準(zhǔn)也是估算出來(lái)的,是否準(zhǔn)確有待商榷。

引申一下,是否可以考慮讓人工智能海量對(duì)戰(zhàn),調(diào)整讓子標(biāo)準(zhǔn)。讓勝負(fù)更加客觀公正。

謝邀。我覺(jué)得這個(gè)問(wèn)題有點(diǎn)無(wú)聊。因?yàn)榭聺嵟c阿爾法狗大戰(zhàn),包括以前阿爾法狗同韓國(guó)李世石大戰(zhàn),目的都是為了檢驗(yàn)人工智能與人類棋手的水平高低,如果換成兩個(gè)阿爾法狗對(duì)戰(zhàn),不論輸贏抑或打平,那都毫無(wú)意義,不能說(shuō)明人工智能超過(guò)人類。舉辦阿爾法狗與世界頂尖圍棋手大賽,目的是為了更好研發(fā)人工智能服務(wù)的。

兩個(gè)阿爾法狗彼此對(duì)決,雙方剛開(kāi)始分別知道對(duì)方是怎么運(yùn)算的,那么A每下一步棋,都會(huì)推演B怎么下,然后開(kāi)始設(shè)計(jì)各種陰謀詭計(jì)。

同時(shí)B也會(huì)這么干。

經(jīng)過(guò)無(wú)數(shù)次對(duì)弈之后,阿爾法go-A和B會(huì)成為我們都不認(rèn)識(shí)的集所有陰謀詭計(jì)之大全的超級(jí)智能機(jī)器人,從甩李世石十條街,變成甩1000000000條街。這種“狗”以后會(huì)把我們虐哭。

而且因?yàn)?,機(jī)器學(xué)習(xí)也有隨機(jī)性,優(yōu)勢(shì)會(huì)積累放大,一年之后,阿爾法go-A或B會(huì)變得實(shí)力懸殊,一年后,兩者的對(duì)弈狀態(tài)是,要么是A一直碾壓B,要么是B一直碾壓A。

謝謝邀請(qǐng)!對(duì)圍棋了解不多,但對(duì)這件事兒還是有所了解,一方面說(shuō)明了人工智能在某些方面要強(qiáng)于人腦,另一方面,人腦思考能力還是有局限性,而人工智能會(huì)因人類科技的發(fā)展越來(lái)越強(qiáng)!

如您所說(shuō),如果是兩個(gè)機(jī)器人比,我感覺(jué)會(huì)不相上下,打成平局,畢竟人工智能是人創(chuàng)造出來(lái)的,各種程序也是由人設(shè)計(jì)的。但這種可比性我感覺(jué)毫無(wú)意義,結(jié)果也證明不了什么,只能是看看稀罕!

依您提出的問(wèn)題,我想反問(wèn)一下:人工智能越來(lái)越進(jìn)步的同時(shí)人類會(huì)不會(huì)退化?

狗狗本來(lái)就是這么下棋的,它的學(xué)習(xí)就是自我對(duì)弈,包括在比賽時(shí),它的每一步用時(shí)也是都花在自我對(duì)弈上,它在每一步的用時(shí)中已經(jīng)不知道下了多少盤(pán)自我對(duì)弈了,并且從中選出一個(gè)勝率最高的落子。

所以兩個(gè)一樣的狗對(duì)弈,如果基礎(chǔ)條件相同,即自我學(xué)習(xí)的時(shí)間相同,那么他們的勝負(fù)應(yīng)該是各半的。其實(shí)真正有意義的是不同的狗之間在同樣的學(xué)習(xí)時(shí)間后對(duì)弈,可以看不同算法的優(yōu)劣。

兩個(gè)阿法狗彼此對(duì)決的棋譜已經(jīng)公開(kāi)了五十局,在deepmind的網(wǎng)站可以下載,黑棋貼七目半的負(fù)擔(dān)略重,白棋的勝率較高一點(diǎn)點(diǎn)。從阿法狗的自我對(duì)決的招法來(lái)看,如果說(shuō)人類棋手的戰(zhàn)斗是一場(chǎng)平面戰(zhàn)爭(zhēng),那么阿法狗的戰(zhàn)斗就是一場(chǎng)海陸空全方位的立體戰(zhàn)爭(zhēng)。我認(rèn)為阿法狗比人類最強(qiáng)的棋手也要高出兩子。假如谷歌公司繼續(xù)提升算法,阿法狗會(huì)變得更強(qiáng),將無(wú)限接近于圍棋上帝。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多