電腦再次叫板人腦 圍棋“人機(jī)世紀(jì)大戰(zhàn)”首場(chǎng)比賽在韓國(guó)上演 北京時(shí)間中午12點(diǎn) 人工智能“阿爾法圍棋”程序與世界冠軍、韓國(guó)職業(yè)棋手李世石對(duì)弈 5場(chǎng)比賽定勝負(fù) 勝者將贏得100萬(wàn)美元獎(jiǎng)金 蝌蚪君開(kāi)始敲字的時(shí)候 比賽已經(jīng)進(jìn)行了2個(gè)多小時(shí) 勝負(fù)難料 一旁觀(guān)戰(zhàn)的人們 也是操碎了心 AlphaGo為何敢叫板近10年來(lái) 平均成績(jī)表現(xiàn)最優(yōu)秀的世界冠軍 阿爾法圍棋(AlphaGo)是一款圍棋人工智能程序。通過(guò)兩個(gè)不同“神經(jīng)網(wǎng)絡(luò)大腦”(棋局評(píng)估器、落子選擇器)合作來(lái)改進(jìn)下棋。 我們換個(gè)最簡(jiǎn)單的說(shuō)法,其實(shí)就是套路啊套路! AlphaGo作為一個(gè)機(jī)器人,也不用吃喝拉撒睡,每天24小時(shí)1440分鐘86400秒就干一件事——下棋!而且它又不會(huì)像人腦一樣“忘記”,所以下過(guò)的所有棋局全都記在腦子里了,這些都是“經(jīng)驗(yàn)”。 等到實(shí)戰(zhàn)的時(shí)候,它看一下棋面就開(kāi)始從過(guò)去的經(jīng)驗(yàn)里找,這個(gè)盤(pán)面哪一路最容易贏,想要贏的話(huà)接下來(lái)應(yīng)該怎么下。 每一步都去重復(fù)這個(gè)做法,弄成數(shù)據(jù)圖就是下面這樣子↓ 而上面提到的棋局評(píng)估器和落子選擇器,其實(shí)就是看AlphaGo看的夠不夠準(zhǔn)、夠不夠遠(yuǎn)。棋局評(píng)估的越準(zhǔn)確、后招看的越遠(yuǎn),贏的勝算就越大。 如果你還不明白……(這智商真是捉急),再舉個(gè)更淺顯的例子,這套路就像屌絲篩選幸福人生之路的過(guò)程: 地球上的所有女人→95后→貌美→D杯→傻白甜→165cm以上→溫柔→輕文藝→賢惠→廚藝好→能生養(yǎng)……→女神→女神愛(ài)上你。 AlphaGo從業(yè)余5段提升到可以擊敗職業(yè)2段棋手的水平,靠的就是這個(gè)。 另外,高手過(guò)招,最后往往看的是心態(tài)。李世石輸了第一局之后表示,棋局較量的時(shí)候其實(shí)情緒也在相互影響,如果緊張則可能有疏漏。但AlphaGo是個(gè)機(jī)器,可以永遠(yuǎn)保持絕對(duì)冷靜。李世石感覺(jué)像是“碰到了一面墻”,自己所有情緒都直接被反彈回來(lái)了,而對(duì)方卻冷冰冰地沒(méi)一點(diǎn)情緒,這種體驗(yàn)著實(shí)讓?zhuān)▂ing)人(xiang)不(fa)爽(hui)。 計(jì)算機(jī)界的各種算法 論計(jì)算能力,人類(lèi)不是計(jì)算機(jī)的對(duì)手。有學(xué)者估算,人的大腦可以每秒運(yùn)行一億億次運(yùn)算。而目前最快的計(jì)算機(jī),中國(guó)的天河二號(hào),已經(jīng)達(dá)到了每秒三點(diǎn)四億億次。 但下棋,不僅僅是計(jì)算這么簡(jiǎn)單。阿爾法圍棋要想贏李世石,需要一套自動(dòng)處理程序,將棋盤(pán)上的每一次變化,翻譯成電路的開(kāi)與關(guān),通過(guò)有限步數(shù)的計(jì)算,得出結(jié)論。這套自動(dòng)處理程序,就是當(dāng)今世界的根基之一——算法。 五把鑰匙里,有一把是對(duì)的,一把一把試過(guò)去,總能打開(kāi)鎖。這就是枚舉法。聽(tīng)起來(lái)有些弱智,但是計(jì)算機(jī)的運(yùn)算速度很快,所以至今,仍有用武之處。 密碼管理服務(wù)商,SplashData,曾經(jīng)公布過(guò)最受歡迎的密碼。黑客們只要把這些密碼試驗(yàn)一遍,就能有很多收獲。 假如一共有二十道選擇題,每道題的答案都是A,你是會(huì)挨個(gè)念一遍呢,還是說(shuō)一句:“都是A”? 想必,正常人肯定會(huì)選擇后者。不僅省時(shí)、省事,而且沒(méi)有信息損失,和“AAAAAAAAAAAAAAAAAAAA”效果一致。 在此過(guò)程中,你通過(guò)統(tǒng)計(jì)分析,總結(jié)出規(guī)律,用更少的字段去描述全部信息,這就是無(wú)損壓縮。 電腦上的無(wú)損壓縮當(dāng)然復(fù)雜地多,有可能出現(xiàn)“ABABAB……”,也有可能出現(xiàn)“AB10AAB”,但其基本理念是一致的。 公鑰加密是一種很古老的做法——在計(jì)算機(jī)領(lǐng)域,超過(guò)十年就算古董了。 我們逛淘寶的時(shí)候,正是經(jīng)歷了這樣的場(chǎng)景。你發(fā)出的付款信息,要經(jīng)過(guò)多個(gè)服務(wù)器轉(zhuǎn)接,如果不加密,你的支付信息就會(huì)暴露在互聯(lián)上;如果你自定義一套密碼,安全倒是安全,但淘寶也不會(huì)認(rèn)。所以,支付時(shí)要使用公鑰加密信息。 為什么谷歌風(fēng)靡全球?因?yàn)?/span>谷歌的搜索引擎特別好用。為什么谷歌的搜索引擎那么好用?因?yàn)?/span>谷歌的匹配與排名算法極其優(yōu)秀。 1998年,谷歌創(chuàng)始人拉里·佩奇和謝爾蓋·布林發(fā)表了名為《解析大規(guī)模超文本網(wǎng)絡(luò)搜索引擎》(The Anatomy of a Large-Scale Hypertextual Web Search Engine)。 因?yàn)榧夹g(shù)限制,我們還不可能讓計(jì)算機(jī)直接模擬人腦,分辨哪些重要、哪些不重要。佩奇和布林找到了一個(gè)計(jì)算機(jī)可以辨識(shí)的指標(biāo):PageRank值。 PageRank值可以簡(jiǎn)單理解為網(wǎng)頁(yè)的被引用次數(shù)。比如你搜索“川菜的招牌菜“,其中,有一百個(gè)網(wǎng)頁(yè)既包含“川菜”又包含“招牌菜”,符合搜索要求。 其中,有九十九個(gè)網(wǎng)頁(yè)通過(guò)超鏈接提到了最后一個(gè)網(wǎng)頁(yè),那么,最后一個(gè)網(wǎng)頁(yè),就是最貼近用戶(hù)需要的。 當(dāng)計(jì)算機(jī)拿到一張照片的時(shí)候,它沿著決策樹(shù),將測(cè)試數(shù)據(jù),和之前的樣本數(shù)據(jù),進(jìn)行對(duì)比。 最后結(jié)果由研究人員對(duì)結(jié)果進(jìn)行判斷,給予獎(jiǎng)勵(lì)或者修正。這樣,計(jì)算機(jī)就能逐步地建立一個(gè)決策體系,準(zhǔn)確地識(shí)別人的表情。 擊敗李世石不代表征服圍棋 只是算法勝利 阿爾法狗首戰(zhàn)告捷,意味著人工智能將可以執(zhí)行更復(fù)雜和有效率的運(yùn)算,處理領(lǐng)域的深度和廣度將會(huì)提升。 而圍棋,并非是簡(jiǎn)單的算法,而是一個(gè)綜合體。即使戰(zhàn)勝了李世石,阿爾法狗也不能真正征服圍棋! 至于勝負(fù)輸贏,還有四場(chǎng)比賽,快來(lái)預(yù)測(cè)一下吧。 |
|