大家好,我是來自硅谷工程師屈直。 要說近期關(guān)于人工智能的大事件,大概要說曾經(jīng)叱咤棋壇的Alpha go,被升級版的Alpha zero以0比100擊敗的新聞了吧。人類第一棋手柯潔“抱定必死信念”的豪言壯語尚在耳邊,沒想到令其飲恨的“大魔王”,這么快就被另一個“大魔王”打倒了,這真是有點(diǎn)高手過招,后浪把前浪拍死在沙灘上的意思。 今日內(nèi)容聚焦 1.“第一棋手”柯潔被alpha go打敗是否意味著一種機(jī)器人終將勝過人類的前兆呢? 2. 圍棋要比國際象棋復(fù)雜多少? 3. 國際象棋最強(qiáng)大腦“深藍(lán)”由何組成? 當(dāng)初“第一棋手”柯潔被alpha go打敗,“機(jī)器人超越人腦”,似乎成了定局。網(wǎng)上一片哀鴻遍野,什么“震驚!人類要被機(jī)器人統(tǒng)治了”之類的言論也是傳得滿天飛。為什么大家的反應(yīng)這么大呢?因?yàn)樵诖蠹业挠∠笾?,能把棋類運(yùn)動玩出成績的,應(yīng)該都是些擁有“超級大腦”極其聰明的人?,F(xiàn)在柯潔、李世石這些“棋圣”竟然在自己最聰明的領(lǐng)域被人工智能擊敗了,這怎能不叫人心生不安?AI在棋類游戲領(lǐng)域?qū)θ四X的“智商壓制”,是否意味著一種機(jī)器人終將勝過人類的前兆呢? 事實(shí)上人類在棋類運(yùn)動中被機(jī)器擊敗,這并不是第一次。本講中,我就帶領(lǐng)大家看看上個世紀(jì)人類棋手和計算機(jī)的交鋒。 時間回到北京時間 1997 年 5 月 11 日的清晨,在與一臺名為“深藍(lán)”的電腦對弈的最后一局中,人類有史以來最偉大的國際象棋大師卡斯帕羅夫面帶沮喪,不得不舉了白旗。這場舉世矚目的人機(jī)大戰(zhàn)以計算機(jī)取勝而落下帷幕,國際象棋領(lǐng)域的“最強(qiáng)大腦”輸給了計算機(jī)。而就在一年前,他還曾經(jīng)在另一場比賽中擊敗“深藍(lán)”,拿到40萬美金獎金。沒想到士別三日,刮目相待。 跟如今的alpha go、alpha zero不同,這個“深藍(lán)”可是一個大家伙,它的外表就像一個黑色的大柜子,重達(dá)1.4噸,有32個節(jié)點(diǎn),每個節(jié)點(diǎn)有8塊專門為進(jìn)行國際象棋對弈設(shè)計的處理器,共計256塊這樣的處理器,集成在IBM的并行運(yùn)算系統(tǒng)中,從而擁有了每秒超過兩億步的計算速度。這是一個很簡單粗暴的邏輯:既然我不會思考,也沒有什么直覺可言,那我就只要通過超人的計算速度,把棋盤上可能出現(xiàn)的每一種可能性都算一遍就可以了——這就是深藍(lán)算法的核心,暴力窮舉。嚴(yán)格來講,這還并不是人工智能,只是在硬件上的強(qiáng)大而已。 “深藍(lán)”的“大腦”——也就是芯片,主要由三部分組成:走棋模塊,評估模塊,以及搜索控制器。這三個部分,都是為了“優(yōu)化運(yùn)算速度”這一終極目標(biāo)而服務(wù)的。 其中需要說一下的是占據(jù)了深藍(lán)“大腦”三分之二面積的評估模塊。它主要分三個部分。 首先是棋子位置評估。它采用的模式是在每一步后對盤面上所有棋子當(dāng)前所處的位置計分,不同棋子處于不同位置的分值都被事先計算好并寫入硬件,在實(shí)戰(zhàn)中,它會靈活的適用當(dāng)前局面下得分較高的走法。為了簡化計算,IBM團(tuán)隊(duì)還根據(jù)大量的大師級棋譜,向“深藍(lán)”輸入了8000多種行棋模式,這就更加簡化了計算的過程。 然后是殘局評估。IBM研制小組向“深藍(lán)”輸入了100年來所有國際特級大師開局和殘局的下法,這就使它能夠在一些時候直接參考?xì)v史上大師們的下法,從而減少計算量。 最后是慢速評估。它牽涉的主要是一些國際象棋的特殊指標(biāo),比如局面的結(jié)構(gòu),個人的棋風(fēng)這一類“看不見摸不著”的東西。當(dāng)然,這些所謂的“特殊指標(biāo)”終究也是反映在棋盤上的。深藍(lán)就可以憑這種評估方法,在全局上進(jìn)行自我調(diào)整。 事實(shí)上,卡斯帕羅夫在與“深藍(lán)”對奕時,就采用了一些“出奇制勝”的策略。他故意在開局中用出和尋常棋路大相徑庭的“怪招”來干擾“深藍(lán)”的棋路。然而,“深藍(lán)”迅速拋開了那些“套路”,用非人的計算速度碾壓了卡斯帕羅夫。 當(dāng)年這個事情出來以后,人們確實(shí)有些“機(jī)器比人強(qiáng)”的擔(dān)憂,不過心里不禁還有一線希望——因?yàn)槲覀冞€有圍棋。國際象棋只是一個8乘8的格子,每一步只有35種可能,每一盤棋80回合,就算加上各種變量,這個數(shù)量對于計算機(jī)來講也實(shí)在不算大。比如“深藍(lán)”可以算到每一步之后12步棋的信息,而人類最強(qiáng)的棋手也只能做到10步。這就和跟開了掛的選手比賽一樣,輸是很正常的。 那圍棋就復(fù)雜的多了,用“深藍(lán)”的方式肯定無法取勝。它每步有250種可能,一局棋可以長達(dá)150回合。這就不是憑借“粗暴”的計算,蠻力的“強(qiáng)記”,以“固定”的程序邏輯決策,或窮極所有可能性進(jìn)行篩選就可以勝任的了。這導(dǎo)致人類一直相信,再強(qiáng)大的機(jī)器人也是沒有辦法對抗咱們的國粹。但是隨著阿爾法狗出現(xiàn),它很快就讓我們無言了,然后留給我們一連串的興奮與憂傷。 說到興奮,圍棋問題與現(xiàn)實(shí)生活中的問題是相通的,國人甚至將“博弈”圍棋視為洞悉人性、參悟人生的過程。然而,現(xiàn)在下圍棋的卻是一個機(jī)器,意味著這個機(jī)器除擁有超強(qiáng)的記憶能力、邏輯思維能力,還要擁有創(chuàng)造力甚至個性。 柯潔就曾這樣贊嘆過AlphaGo的“棋風(fēng)”:“感覺就像一個有血有肉的人在下棋一樣,該棄的地方也會棄,該退出的地方也會退出,非常均衡的一個棋風(fēng),真是看不出出自程序之手?!?nbsp;AlphaGo有好幾次落子極其“非常規(guī)”,許多專業(yè)棋手都表示“看不懂”。而聶衛(wèi)平甚至表示自己想要對AlphaGo的“驚人一手”脫帽致敬,因?yàn)樗坝貌豢伤甲h的下法辟立了圍棋常識之外的新天地”。也就是說,這不是AlphaGo從既往棋局中“復(fù)制”過來的,而是自己“創(chuàng)造”的戰(zhàn)術(shù)打法。 這個AlphaGo的最主要工作原理,就是近幾年人工智能領(lǐng)域最為熱門,也是我們在之前經(jīng)常提到的“深度學(xué)習(xí)”,通過模仿人類大腦神經(jīng)網(wǎng)絡(luò),讓機(jī)器模擬人腦的機(jī)制進(jìn)行記憶、學(xué)習(xí)、分析、思維,還有創(chuàng)造……這一部分,我將在下一講當(dāng)中,為大家另作介紹。 今天,我主要帶大家回望了一下20年前的“人機(jī)大戰(zhàn)”。從“深藍(lán)”到“阿爾法狗”,人類科技的進(jìn)化史,似乎也是一個人們不斷立flag、又不斷被機(jī)器“吊打”的過程。不過這其中突破性的歷史意義,早已超越勝負(fù)。因?yàn)樵谖磥?,人工智能肯定不單純會用來下棋,像我們前面所講,以及后面會繼續(xù)為大家講的那樣,它會掀起各個領(lǐng)域的產(chǎn)業(yè)變革、經(jīng)濟(jì)變革,甚至是社會變革。 知識清單 1. 事實(shí)上人類在棋類運(yùn)動中被機(jī)器擊敗,AlphaGo并不是第一次。 2. AlphaGo最主要工作原理,就是近幾年人工智能領(lǐng)域最為熱門的“深度學(xué)習(xí)” 3.“深藍(lán)”的“大腦”——也就是芯片,主要由三部分組成:走棋模塊,評估模塊,以及搜索控制器。 今日思考 不過回到棋牌類這個小小的領(lǐng)域,大師們研究棋譜、與人實(shí)戰(zhàn)好幾千年,又從中參悟到了那么人生哲理和自然規(guī)律,可以說是源遠(yuǎn)流長了,沒成想?yún)s被機(jī)器人打敗。如果換做你的話,如果你所玩的游戲中的“最強(qiáng)玩家”被機(jī)器擊敗,這會影響從這個游戲中尋找快樂的動力嗎?你對“人類最強(qiáng)大腦被機(jī)器人擊敗”這件事怎么看呢? 歡迎把你的見解在評論區(qū)與我們分享。我是屈直,我們下期再見。
知之×世界說重磅推出知識付費(fèi)課程:輸?shù)舻奈磥?/span> 掃描下方二維碼,《輸?shù)舻奈磥怼犯嗑蕛?nèi)容盡在“知之”微信公眾號 |
|