深度解析 | 阿爾法狗首戰(zhàn)告捷，它憑什么戰(zhàn)勝李世石？

平方元 2016-03-18

展開(kāi)全文

電腦再次叫板人腦

圍棋“人機(jī)世紀(jì)大戰(zhàn)”首場(chǎng)比賽在韓國(guó)上演

北京時(shí)間中午12點(diǎn)

人工智能“阿爾法圍棋”程序與世界冠軍、韓國(guó)職業(yè)棋手李世石對(duì)弈

5場(chǎng)比賽定勝負(fù)

勝者將贏得100萬(wàn)美元獎(jiǎng)金

蝌蚪君開(kāi)始敲字的時(shí)候

比賽已經(jīng)進(jìn)行了2個(gè)多小時(shí)

勝負(fù)難料

一旁觀(guān)戰(zhàn)的人們

也是操碎了心

AlphaGo為何敢叫板近10年來(lái)

平均成績(jī)表現(xiàn)最優(yōu)秀的世界冠軍

阿爾法圍棋（AlphaGo）是一款圍棋人工智能程序。通過(guò)兩個(gè)不同“神經(jīng)網(wǎng)絡(luò)大腦”（棋局評(píng)估器、落子選擇器）合作來(lái)改進(jìn)下棋。

我們換個(gè)最簡(jiǎn)單的說(shuō)法，其實(shí)就是套路啊套路！

AlphaGo作為一個(gè)機(jī)器人，也不用吃喝拉撒睡，每天24小時(shí)1440分鐘86400秒就干一件事——下棋！而且它又不會(huì)像人腦一樣“忘記”，所以下過(guò)的所有棋局全都記在腦子里了，這些都是“經(jīng)驗(yàn)”。

等到實(shí)戰(zhàn)的時(shí)候，它看一下棋面就開(kāi)始從過(guò)去的經(jīng)驗(yàn)里找，這個(gè)盤(pán)面哪一路最容易贏，想要贏的話(huà)接下來(lái)應(yīng)該怎么下。

每一步都去重復(fù)這個(gè)做法，弄成數(shù)據(jù)圖就是下面這樣子↓

而上面提到的棋局評(píng)估器和落子選擇器，其實(shí)就是看AlphaGo看的夠不夠準(zhǔn)、夠不夠遠(yuǎn)。棋局評(píng)估的越準(zhǔn)確、后招看的越遠(yuǎn)，贏的勝算就越大。

如果你還不明白……（這智商真是捉急），再舉個(gè)更淺顯的例子，這套路就像屌絲篩選幸福人生之路的過(guò)程：

地球上的所有女人→95后→貌美→D杯→傻白甜→165cm以上→溫柔→輕文藝→賢惠→廚藝好→能生養(yǎng)……→女神→女神愛(ài)上你。

AlphaGo從業(yè)余5段提升到可以擊敗職業(yè)2段棋手的水平，靠的就是這個(gè)。

另外，高手過(guò)招，最后往往看的是心態(tài)。李世石輸了第一局之后表示，棋局較量的時(shí)候其實(shí)情緒也在相互影響，如果緊張則可能有疏漏。但AlphaGo是個(gè)機(jī)器，可以永遠(yuǎn)保持絕對(duì)冷靜。李世石感覺(jué)像是“碰到了一面墻”，自己所有情緒都直接被反彈回來(lái)了，而對(duì)方卻冷冰冰地沒(méi)一點(diǎn)情緒，這種體驗(yàn)著實(shí)讓?zhuān)▂ing）人（xiang）不（fa）爽（hui）。

計(jì)算機(jī)界的各種算法

論計(jì)算能力，人類(lèi)不是計(jì)算機(jī)的對(duì)手。有學(xué)者估算，人的大腦可以每秒運(yùn)行一億億次運(yùn)算。而目前最快的計(jì)算機(jī)，中國(guó)的天河二號(hào)，已經(jīng)達(dá)到了每秒三點(diǎn)四億億次。

但下棋，不僅僅是計(jì)算這么簡(jiǎn)單。阿爾法圍棋要想贏李世石，需要一套自動(dòng)處理程序，將棋盤(pán)上的每一次變化，翻譯成電路的開(kāi)與關(guān)，通過(guò)有限步數(shù)的計(jì)算，得出結(jié)論。這套自動(dòng)處理程序，就是當(dāng)今世界的根基之一——算法。

枚舉法

五把鑰匙里，有一把是對(duì)的，一把一把試過(guò)去，總能打開(kāi)鎖。這就是枚舉法。聽(tīng)起來(lái)有些弱智，但是計(jì)算機(jī)的運(yùn)算速度很快，所以至今，仍有用武之處。

密碼管理服務(wù)商，SplashData，曾經(jīng)公布過(guò)最受歡迎的密碼。黑客們只要把這些密碼試驗(yàn)一遍，就能有很多收獲。

數(shù)據(jù)壓縮

假如一共有二十道選擇題，每道題的答案都是A，你是會(huì)挨個(gè)念一遍呢，還是說(shuō)一句：“都是A”？

想必，正常人肯定會(huì)選擇后者。不僅省時(shí)、省事，而且沒(méi)有信息損失，和“AAAAAAAAAAAAAAAAAAAA”效果一致。

在此過(guò)程中，你通過(guò)統(tǒng)計(jì)分析，總結(jié)出規(guī)律，用更少的字段去描述全部信息，這就是無(wú)損壓縮。

電腦上的無(wú)損壓縮當(dāng)然復(fù)雜地多，有可能出現(xiàn)“ABABAB……”，也有可能出現(xiàn)“AB10AAB”，但其基本理念是一致的。

公鑰加密

公鑰加密是一種很古老的做法——在計(jì)算機(jī)領(lǐng)域，超過(guò)十年就算古董了。

我們逛淘寶的時(shí)候，正是經(jīng)歷了這樣的場(chǎng)景。你發(fā)出的付款信息，要經(jīng)過(guò)多個(gè)服務(wù)器轉(zhuǎn)接，如果不加密，你的支付信息就會(huì)暴露在互聯(lián)上；如果你自定義一套密碼，安全倒是安全，但淘寶也不會(huì)認(rèn)。所以，支付時(shí)要使用公鑰加密信息。

匹配與排名

為什么谷歌風(fēng)靡全球？因?yàn)?/span>谷歌的搜索引擎特別好用。為什么谷歌的搜索引擎那么好用？因?yàn)?/span>谷歌的匹配與排名算法極其優(yōu)秀。

1998年，谷歌創(chuàng)始人拉里·佩奇和謝爾蓋·布林發(fā)表了名為《解析大規(guī)模超文本網(wǎng)絡(luò)搜索引擎》（The Anatomy of a Large-Scale Hypertextual Web Search Engine）。

因?yàn)榧夹g(shù)限制，我們還不可能讓計(jì)算機(jī)直接模擬人腦，分辨哪些重要、哪些不重要。佩奇和布林找到了一個(gè)計(jì)算機(jī)可以辨識(shí)的指標(biāo)：PageRank值。

PageRank值可以簡(jiǎn)單理解為網(wǎng)頁(yè)的被引用次數(shù)。比如你搜索“川菜的招牌菜“，其中，有一百個(gè)網(wǎng)頁(yè)既包含“川菜”又包含“招牌菜”，符合搜索要求。

其中，有九十九個(gè)網(wǎng)頁(yè)通過(guò)超鏈接提到了最后一個(gè)網(wǎng)頁(yè)，那么，最后一個(gè)網(wǎng)頁(yè)，就是最貼近用戶(hù)需要的。

圖像識(shí)別

當(dāng)計(jì)算機(jī)拿到一張照片的時(shí)候，它沿著決策樹(shù)，將測(cè)試數(shù)據(jù)，和之前的樣本數(shù)據(jù)，進(jìn)行對(duì)比。

最后結(jié)果由研究人員對(duì)結(jié)果進(jìn)行判斷，給予獎(jiǎng)勵(lì)或者修正。這樣，計(jì)算機(jī)就能逐步地建立一個(gè)決策體系，準(zhǔn)確地識(shí)別人的表情。

擊敗李世石不代表征服圍棋

只是算法勝利

阿爾法狗首戰(zhàn)告捷，意味著人工智能將可以執(zhí)行更復(fù)雜和有效率的運(yùn)算，處理領(lǐng)域的深度和廣度將會(huì)提升。

而圍棋，并非是簡(jiǎn)單的算法，而是一個(gè)綜合體。即使戰(zhàn)勝了李世石，阿爾法狗也不能真正征服圍棋！

至于勝負(fù)輸贏，還有四場(chǎng)比賽，快來(lái)預(yù)測(cè)一下吧。

版權(quán)聲明

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶(hù)發(fā)布，不代表本站觀(guān)點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自：平方元 > 《閱讀》

舉報(bào)/認(rèn)領(lǐng)