核心提示:AlphaGo與李世石對戰(zhàn)已經(jīng)到了第五局,面對“人造吳清源”江鑄久分析了這場人機(jī)對弈的實質(zhì)是人人大戰(zhàn),早期的人機(jī)大戰(zhàn)由于沒有足夠數(shù)據(jù)的支持都是人贏。這次AlphaGo的表現(xiàn)確實超出職業(yè)界圍棋手的成長思維 鳳凰衛(wèi)視3月15日《鏘鏘三人行》,以下為文字實錄: 竇文濤:《鏘鏘三人行》,今天的兩位嘉賓絕對體現(xiàn)了業(yè)余了18年的《鏘鏘三人行》正在向?qū)I(yè)化挺進(jìn),一位是咱們來過的,咱們圍棋的國手,江鑄久九段老師。感覺剛從武當(dāng)山上下來,江鑄久九段老師,上次您來我們這兒,您記得聊的還是棋圣吳清源老師,這回您來是因為出了個人造吳清源。 江鑄久:人機(jī)大戰(zhàn)事實是人人大戰(zhàn) 江鑄久:對,真的是可以這么說。 竇文濤:是吧,雖然偶爾出點葷招,但是感覺也是大智若愚。 江鑄久:是,而且它能下出很多創(chuàng)造性的棋來,其中一招我們待會兒會講到。我當(dāng)時就是說很少有這種時候,就是看到這步的時候,就覺得有點熱淚盈眶的感覺。 竇文濤:好,現(xiàn)在韓國那邊有李世石,我們這邊有江鑄久,韓國那邊有阿爾法狗,我們這邊也得來個人機(jī)大戰(zhàn)。您算人,您只能算機(jī),不好意思,計算機(jī),因為這位是咱們香港科技大學(xué)計算機(jī)系的系主任楊強老師。不過,我覺著楊強老師長的像下圍棋的,你覺著嗎,他有點像李世石那模樣,是嗎? 江鑄久:對對對。其實我們也一直說這次媒體寫的人機(jī)大戰(zhàn)事實上是人人大戰(zhàn)。因為是人跟職業(yè)棋手,就是說比較好的至今為止,職業(yè)棋手是人類最好的下棋的一些代表。跟人類智慧、科技,人類創(chuàng)造出來的智慧,從高科技那代來跟棋對決。 楊強:對,不僅如此,其實這次很重要的特點是大數(shù)據(jù),那些數(shù)據(jù)是什么呢,就是以前人和人之間對弈的那些數(shù)據(jù)。從六段到九段收集了很多很多的數(shù)據(jù),最后產(chǎn)生了,這是具有多大呢,三千萬個盤來訓(xùn)練這只阿爾法狗。所以,有個笑話,說第一局完了,把計算機(jī)蓋一打開,柯潔爬出來了。其實更恰當(dāng)?shù)膽?yīng)該是里邊爬出了一萬多人。 竇文濤:怎么說? 楊強:都是下圍棋的。因為他們提供了數(shù)據(jù),對吧? 竇文濤:就是前三局輸了,我看見韓國人非常有民族自尊心,在這寫文章說谷歌應(yīng)該向全世界道歉,對吧?它侮辱我們李世石,因為他說,但是我就覺得韓國人是氣的,我覺得有點不知道他在說什么了。他說他這個玩意兒是運用了幾百臺還是上千臺的電腦,然后他不是利用他已有的信息來跟我們打,他是看到李世石下的招之后,然后他怎么著認(rèn)真運算之后,他再下招。后來有的網(wǎng)友就說那怎么意思,那還讓阿爾法下盲棋不成,是吧? 江鑄久:早期人機(jī)大戰(zhàn) 大數(shù)據(jù)上面支持不了 江鑄久:這也是我覺得我感興趣的地方,因為我跟著人工智能下圍棋也二十多年了。 竇文濤:你也下過? 江鑄久:最早的一批90年代,1991年、1992年那些研究,人工智能就是電腦下棋的在硅谷的時候,我就跟他們有對話。他們那會兒把我請去的時候。 竇文濤:是跟人對話,還是跟狗對話? 江鑄久:跟機(jī)器。 竇文濤:你跟狗早就下過? 江鑄久:跟電腦,這樣二十多年來就是有一些我們說的電腦專家們像風(fēng)一樣,利用個人的智慧和能力,不停地在研究電腦跟人對局會怎么樣。但那個時候,就是在數(shù)據(jù)方面,它就支持不了。最明顯的例子就是,最早我跟他們下的是讓十幾個,一般人讓九個我們就說很業(yè)余了。讓十幾個,我們怎么能夠?qū)Ω兜昧怂?。就是很快摸著他?guī)律,你下幾個死子在那兒,機(jī)器就會不停地開心地吃你,而下圍棋。 竇文濤:真是個鼠目寸光的家伙。 江鑄久:對,而下圍棋最重要的一點就是講效率,所以我們就利用他這弱點,你丟幾個棄子我們說,他會多花一倍的兵力,1.5倍、1.4倍,你就從那里邊占到便宜了。 打劫使AlphaGo需要大量搜索 李世石這局贏得機(jī)會非常大 竇文濤:這樣江老師,咱們先找點直播的感覺。我們是今天晚上播這個節(jié)目,但是現(xiàn)在是我們下午錄像,現(xiàn)在的時間是下午的兩點50分,這最后一局正在人機(jī)大戰(zhàn)。你看著這個直播的這個棋盤,我想知道您對現(xiàn)在的形勢怎么分析?這一局,李世石能贏得下來嗎? 江鑄久:我覺著這局李世石的機(jī)會非常大,如果現(xiàn)在要讓我投的話,我覺得李世石贏的贏面非常非常大,如果李世石不出現(xiàn)重大失誤的話。而且,我們看周圍,我想李世石也一定想到了,有機(jī)會就給你造成比較復(fù)雜的打劫,打劫看樣子對計算機(jī)來說它的搜索的東西要多得多。 楊強:非常多。 竇文濤:你覺得他打劫嗎? 楊強:我來解釋一下這個原理。這個阿爾法狗它的原理實際上就是在搜索一個很大的空間。咱們打個比方吧,就好像是一個人在一個很大的迷宮里面,他想走出去,他怎么走出去呢?他只能搜索,他看看往這邊行不行,往那邊走行不行。那搜索的空間如果大的話,如果問題復(fù)雜的話,那么他在一定時間之內(nèi)只能搜索很小的一部分的空間,所以犯錯誤的機(jī)會就會大。所以,如果這個打劫發(fā)生的越早,那么這個混亂度就會越大。 江鑄久:而且最好這個打劫是發(fā)生在不止一塊棋,發(fā)生在兩塊棋、三塊棋,關(guān)聯(lián)五六塊的時候,事實上我們看李世石很明顯地這盤棋,現(xiàn)在正在進(jìn)行的,就是在各種變化里面有機(jī)會就給你搞個打劫出來,或者嚇唬它,下一步你要這么來的話,我就要跟你玩打劫了。那電腦如果是它的弱點的話,原來說它不會打劫,其實它是會的,那可能是我們猜測是它的后一個選項,第一個選項不是跟打劫。 楊強:不喜歡打劫。 江鑄久:對,不喜歡打劫。 竇文濤:這個為什么?從人工智能來講。 楊強:這是為什么呢?這個阿爾法狗里面有兩塊最重要的軟件,一塊是給你一個棋盤,它來評估這個棋盤對我多有利;另外一個是說給你一個棋盤,下面這個子應(yīng)該走到哪兒。 竇文濤:說一個叫策略網(wǎng)絡(luò),一個叫價值網(wǎng)絡(luò)。 楊強:對,說的太對了,那么這兩個網(wǎng)絡(luò)在什么時候會犯怵呢?就是在打劫這種情況,我們叫非確定現(xiàn)象出現(xiàn)了,可能這樣,可能那樣;也許這樣,也許那樣。那么它把這些情況都放到那兒的時候,它發(fā)現(xiàn)一個現(xiàn)象出現(xiàn)了,數(shù)據(jù)不夠,訓(xùn)練的不夠。所以,這個時候。 竇文濤:訓(xùn)練還不夠? 楊強:還不夠,對,還不夠,因為那個數(shù)實在是太大了,那個數(shù)有多大呢,就是那個搜索數(shù)。有人估算過,它的那個總數(shù),那個棋盤的總數(shù)比這個全宇宙的原子還要多。 竇文濤:還多得多。 楊強:還多得多。 竇文濤:全宇宙的原子才十的八次方,大家聽著好像不多,其實這就是那個數(shù)學(xué)那個效應(yīng),十乘十乘80次,那就無限大了。 江鑄久:反正對人類來說,對職業(yè)棋手來說,他看打劫他是這樣看的。一,這個打劫對我有沒有利;二,我打劫下去的劫財對我有利不有利,不有利我就不玩,有利,只要有利的時候我開始給你打。不確定的時候,他就靠我們說靠邏輯性來推兩下,這個打劫這個局面對我有利,我跟你打,對我沒利,我不跟你打。有利的情況就是我看看劫財對我有不有利。 江鑄久:計算機(jī)很難趕上人類“虛”的方面 竇文濤:所以我請教您一個哲學(xué)問題,也可以說人類學(xué)的問題了。感性、直覺它最終是不是無限大的計算和無限大的邏輯?只不過人腦不能進(jìn)行那么精確的計算,所以培養(yǎng)出一種。實際上還是一種模糊的理性,基本上是這么回事嗎? 江鑄久:這我就不知道,但是我知道下棋對于虛的東西,原來我們一直覺得計算機(jī)很難趕上我們的一點就是在虛的方面表現(xiàn)。比方說什么是虛呢?如果這個地方拆解,計算機(jī)很難計算出來,如果這個地方死活,它都是局部空間,而一上來的布局,考慮到戰(zhàn)略的時候,那是需要你的經(jīng)驗,你可能有好幾條路要走,可以走,似乎都不錯。而這個時候,人的直覺、經(jīng)驗加上你的邏輯訓(xùn)練出來,你就會選一個,我可以選一個大概方向不錯。而計算機(jī)如果這個時候,不要說計算機(jī),就只說人,我們往前面推一推讓我聯(lián)想到的就是當(dāng)時在上世紀(jì)一九三幾年的時候,日本理論比較厲害的就是,代表是木谷實,他就是盡可能地把圍棋上的變化我都算變,來克制了很多對手。擂臺賽九連勝這些新的,但是緊跟著從中國我們都知道,中國去了吳清源老師,而后來吳清源老師大家知道,他的理論是我無法窮盡,我的計算無法窮盡,而且也很花時間,那么我就是憑著我的經(jīng)驗我來選出五六條路,然后我把旁邊的兩條路先去掉,剩下三個了,我把最弱的一條再去掉。 竇文濤:這不就是阿爾法狗的思路嗎? 楊強:完全是阿爾法狗的思路。 江鑄久:是。 楊強:西方的叫法叫蒙特卡洛搜索樹,這個也差不多。 竇文濤:為什么,因為你們愛賭博,是嗎? 楊強:這跟賭博有關(guān),因為你是選擇在這么多里面你選擇幾個,然后你就拿它來計算了,是一個我們叫抽樣,所以這個抽樣如果你抽的夠多,如果你的數(shù)據(jù)夠多,你可以非常準(zhǔn)的。所以,這個也就是完全是您剛才說的吳清源老師的這個直覺。 掃描屏幕下方的二維碼關(guān)注鳳凰衛(wèi)視官方微信平臺,更多精彩盡在鳳凰私享會! 點擊關(guān)注@鳳凰私享會,更多精彩內(nèi)容實時掌握 《鏘鏘三人行》鳳凰衛(wèi)視中文臺播出[節(jié)目專區(qū)] 主持人:竇文濤[主持人專區(qū)] 首播時間:周一到周五 23:00-23:35 重播時間:周一至周五 13:00-13:35 |
|