二十年前一場人機(jī)大戰(zhàn)預(yù)示了未來？

老工匠心隨天地 2018-01-29

展開全文

大家好，我是來自硅谷工程師屈直。

要說近期關(guān)于人工智能的大事件，大概要說曾經(jīng)叱咤棋壇的Alpha go，被升級版的Alpha zero以0比100擊敗的新聞了吧。人類第一棋手柯潔“抱定必死信念”的豪言壯語尚在耳邊，沒想到令其飲恨的“大魔王”，這么快就被另一個“大魔王”打倒了，這真是有點(diǎn)高手過招，后浪把前浪拍死在沙灘上的意思。

今日內(nèi)容聚焦

1.“第一棋手”柯潔被alpha go打敗是否意味著一種機(jī)器人終將勝過人類的前兆呢？

2. 圍棋要比國際象棋復(fù)雜多少？

3. 國際象棋最強(qiáng)大腦“深藍(lán)”由何組成？

當(dāng)初“第一棋手”柯潔被alpha go打敗，“機(jī)器人超越人腦”，似乎成了定局。網(wǎng)上一片哀鴻遍野，什么“震驚！人類要被機(jī)器人統(tǒng)治了”之類的言論也是傳得滿天飛。為什么大家的反應(yīng)這么大呢？因?yàn)樵诖蠹业挠∠笾?，能把棋類運(yùn)動玩出成績的，應(yīng)該都是些擁有“超級大腦”極其聰明的人?，F(xiàn)在柯潔、李世石這些“棋圣”竟然在自己最聰明的領(lǐng)域被人工智能擊敗了，這怎能不叫人心生不安？AI在棋類游戲領(lǐng)域?qū)θ四X的“智商壓制”，是否意味著一種機(jī)器人終將勝過人類的前兆呢？

事實(shí)上人類在棋類運(yùn)動中被機(jī)器擊敗，這并不是第一次。本講中，我就帶領(lǐng)大家看看上個世紀(jì)人類棋手和計算機(jī)的交鋒。

時間回到北京時間 1997 年 5 月 11 日的清晨，在與一臺名為“深藍(lán)”的電腦對弈的最后一局中，人類有史以來最偉大的國際象棋大師卡斯帕羅夫面帶沮喪，不得不舉了白旗。這場舉世矚目的人機(jī)大戰(zhàn)以計算機(jī)取勝而落下帷幕，國際象棋領(lǐng)域的“最強(qiáng)大腦”輸給了計算機(jī)。而就在一年前，他還曾經(jīng)在另一場比賽中擊敗“深藍(lán)”，拿到40萬美金獎金。沒想到士別三日，刮目相待。

跟如今的alpha go、alpha zero不同，這個“深藍(lán)”可是一個大家伙，它的外表就像一個黑色的大柜子，重達(dá)1.4噸，有32個節(jié)點(diǎn)，每個節(jié)點(diǎn)有8塊專門為進(jìn)行國際象棋對弈設(shè)計的處理器，共計256塊這樣的處理器，集成在IBM的并行運(yùn)算系統(tǒng)中，從而擁有了每秒超過兩億步的計算速度。這是一個很簡單粗暴的邏輯：既然我不會思考，也沒有什么直覺可言，那我就只要通過超人的計算速度，把棋盤上可能出現(xiàn)的每一種可能性都算一遍就可以了——這就是深藍(lán)算法的核心，暴力窮舉。嚴(yán)格來講，這還并不是人工智能，只是在硬件上的強(qiáng)大而已。

“深藍(lán)”的“大腦”——也就是芯片，主要由三部分組成：走棋模塊，評估模塊，以及搜索控制器。這三個部分，都是為了“優(yōu)化運(yùn)算速度”這一終極目標(biāo)而服務(wù)的。

其中需要說一下的是占據(jù)了深藍(lán)“大腦”三分之二面積的評估模塊。它主要分三個部分。

首先是棋子位置評估。它采用的模式是在每一步后對盤面上所有棋子當(dāng)前所處的位置計分，不同棋子處于不同位置的分值都被事先計算好并寫入硬件，在實(shí)戰(zhàn)中，它會靈活的適用當(dāng)前局面下得分較高的走法。為了簡化計算，IBM團(tuán)隊(duì)還根據(jù)大量的大師級棋譜，向“深藍(lán)”輸入了8000多種行棋模式，這就更加簡化了計算的過程。

然后是殘局評估。IBM研制小組向“深藍(lán)”輸入了100年來所有國際特級大師開局和殘局的下法，這就使它能夠在一些時候直接參考?xì)v史上大師們的下法，從而減少計算量。

最后是慢速評估。它牽涉的主要是一些國際象棋的特殊指標(biāo)，比如局面的結(jié)構(gòu)，個人的棋風(fēng)這一類“看不見摸不著”的東西。當(dāng)然，這些所謂的“特殊指標(biāo)”終究也是反映在棋盤上的。深藍(lán)就可以憑這種評估方法，在全局上進(jìn)行自我調(diào)整。

事實(shí)上，卡斯帕羅夫在與“深藍(lán)”對奕時，就采用了一些“出奇制勝”的策略。他故意在開局中用出和尋常棋路大相徑庭的“怪招”來干擾“深藍(lán)”的棋路。然而，“深藍(lán)”迅速拋開了那些“套路”，用非人的計算速度碾壓了卡斯帕羅夫。

當(dāng)年這個事情出來以后，人們確實(shí)有些“機(jī)器比人強(qiáng)”的擔(dān)憂，不過心里不禁還有一線希望——因?yàn)槲覀冞€有圍棋。國際象棋只是一個8乘8的格子，每一步只有35種可能，每一盤棋80回合，就算加上各種變量，這個數(shù)量對于計算機(jī)來講也實(shí)在不算大。比如“深藍(lán)”可以算到每一步之后12步棋的信息，而人類最強(qiáng)的棋手也只能做到10步。這就和跟開了掛的選手比賽一樣，輸是很正常的。

那圍棋就復(fù)雜的多了，用“深藍(lán)”的方式肯定無法取勝。它每步有250種可能，一局棋可以長達(dá)150回合。這就不是憑借“粗暴”的計算，蠻力的“強(qiáng)記”，以“固定”的程序邏輯決策，或窮極所有可能性進(jìn)行篩選就可以勝任的了。這導(dǎo)致人類一直相信，再強(qiáng)大的機(jī)器人也是沒有辦法對抗咱們的國粹。但是隨著阿爾法狗出現(xiàn)，它很快就讓我們無言了，然后留給我們一連串的興奮與憂傷。

說到興奮，圍棋問題與現(xiàn)實(shí)生活中的問題是相通的，國人甚至將“博弈”圍棋視為洞悉人性、參悟人生的過程。然而，現(xiàn)在下圍棋的卻是一個機(jī)器，意味著這個機(jī)器除擁有超強(qiáng)的記憶能力、邏輯思維能力，還要擁有創(chuàng)造力甚至個性。

柯潔就曾這樣贊嘆過AlphaGo的“棋風(fēng)”：“感覺就像一個有血有肉的人在下棋一樣，該棄的地方也會棄，該退出的地方也會退出，非常均衡的一個棋風(fēng)，真是看不出出自程序之手?！?nbsp;AlphaGo有好幾次落子極其“非常規(guī)”，許多專業(yè)棋手都表示“看不懂”。而聶衛(wèi)平甚至表示自己想要對AlphaGo的“驚人一手”脫帽致敬，因?yàn)樗坝貌豢伤甲h的下法辟立了圍棋常識之外的新天地”。也就是說，這不是AlphaGo從既往棋局中“復(fù)制”過來的，而是自己“創(chuàng)造”的戰(zhàn)術(shù)打法。

這個AlphaGo的最主要工作原理，就是近幾年人工智能領(lǐng)域最為熱門，也是我們在之前經(jīng)常提到的“深度學(xué)習(xí)”，通過模仿人類大腦神經(jīng)網(wǎng)絡(luò)，讓機(jī)器模擬人腦的機(jī)制進(jìn)行記憶、學(xué)習(xí)、分析、思維，還有創(chuàng)造……這一部分，我將在下一講當(dāng)中，為大家另作介紹。

今天，我主要帶大家回望了一下20年前的“人機(jī)大戰(zhàn)”。從“深藍(lán)”到“阿爾法狗”，人類科技的進(jìn)化史，似乎也是一個人們不斷立flag、又不斷被機(jī)器“吊打”的過程。不過這其中突破性的歷史意義，早已超越勝負(fù)。因?yàn)樵谖磥?，人工智能肯定不單純會用來下棋，像我們前面所講，以及后面會繼續(xù)為大家講的那樣，它會掀起各個領(lǐng)域的產(chǎn)業(yè)變革、經(jīng)濟(jì)變革，甚至是社會變革。

知識清單

1. 事實(shí)上人類在棋類運(yùn)動中被機(jī)器擊敗，AlphaGo并不是第一次。

2. AlphaGo最主要工作原理，就是近幾年人工智能領(lǐng)域最為熱門的“深度學(xué)習(xí)”

3.“深藍(lán)”的“大腦”——也就是芯片，主要由三部分組成：走棋模塊，評估模塊，以及搜索控制器。

今日思考

不過回到棋牌類這個小小的領(lǐng)域，大師們研究棋譜、與人實(shí)戰(zhàn)好幾千年，又從中參悟到了那么人生哲理和自然規(guī)律，可以說是源遠(yuǎn)流長了，沒成想?yún)s被機(jī)器人打敗。如果換做你的話，如果你所玩的游戲中的“最強(qiáng)玩家”被機(jī)器擊敗，這會影響從這個游戲中尋找快樂的動力嗎？你對“人類最強(qiáng)大腦被機(jī)器人擊敗”這件事怎么看呢？

歡迎把你的見解在評論區(qū)與我們分享。我是屈直，我們下期再見。

知之×世界說重磅推出知識付費(fèi)課程：輸?shù)舻奈磥?/span>
掃描下方二維碼，《輸?shù)舻奈磥怼犯嗑蕛?nèi)容盡在“知之”微信公眾號

本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點(diǎn)擊一鍵舉報。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：老工匠心隨天地 > 《科技》

舉報/認(rèn)領(lǐng)