文/張蕾應(yīng)虹霞車?yán)虬l(fā)自北京、廊坊、日本東京、大阪 2016年3月,《圍棋天地》第6期,首席編輯張大勇給農(nóng)心杯棋評起的標(biāo)題是《帝國斜陽》。 “人類圍棋創(chuàng)造了帝國,大家在這個帝國之中進(jìn)行爭霸。但是我覺得,這是我們最后一期純?nèi)祟悋澹▋?nèi)容),從下期開始有計(jì)算機(jī)的交融。起名叫《帝國斜陽》——這是純?nèi)祟悋宓狞S昏?!?/p> 在那期雜志后,英國DeepMind公司出品的圍棋軟件AlphaGo4:1擊敗了韓國的李世石九段,突破了人工智能(AI)在圍棋上的無法在互先的比賽中戰(zhàn)勝人類頂級高手的上限。 新一期的雜志被命名為《駭世晨曦》。 “當(dāng)時寫《帝國斜陽》的時候,還是認(rèn)為李世石肯定贏?!?/p> “可是你用’斜陽’,夕陽西下的這種感覺都有了。” “我當(dāng)時說’斜陽’,是指(一天中)最后的時光,正常的晝夜輪替,并不是要崩塌了,并不是說你不行?!?/p> 可這好像成了一道悲觀的寓言。 “輸完三盤棋以后,整個棋界微信圈都特別悲涼,覺得突然來了一個外星人,災(zāi)難來臨了一樣?!?/p> 迷戀與恐懼 張大勇與當(dāng)今世界圍棋第一人柯潔合著了《夢戰(zhàn)》一書,記述后者在第二屆夢百合杯決賽中戰(zhàn)勝李世石的驚險歷程和內(nèi)心成長。當(dāng)時兩人擺棋時,一家媒體來采訪,第一個問題就是,你希不希望人工智能圍棋出現(xiàn)?柯潔直接回:當(dāng)然不希望,因?yàn)槲艺幵邳S金時代。 張大勇與當(dāng)今世界圍棋第一人柯潔合著了《夢戰(zhàn)》 張大勇明白,李世石的脆敗,這使得棋手的神圣感淡化了很多,“棋界有沮喪的感覺”,曾經(jīng)篤定自己已經(jīng)爬上圍棋世界頂峰的、屈指可數(shù)的高手們被迫環(huán)顧四周,“發(fā)現(xiàn)很多高峰在旁邊立著”,“這個感覺,我覺得對于頂尖高手來講,對他內(nèi)心的摧殘非常難受。” 大事件面前,人們開始分化。有人頑固。一位圈內(nèi)人士本來身體不好,因?yàn)槔钍朗斊?,病情加重,“他是特別傷心,發(fā)自內(nèi)心地傷心。他病休了一段時間,他覺得人類圍棋竟然被一個計(jì)算機(jī)打成這樣,他在AlphaGo之后數(shù)個月,極力證明AlphaGo走的棋不行?!钡搅巳ツ甑捉衲瓿魽lphaGo化身Master網(wǎng)絡(luò)快棋對職業(yè)高手60連勝后,“他就變成了回避這個的事情。有點(diǎn)像剪辮子,有的人受不了,要藏起來,堅(jiān)決不剪,……他平日性格非常好,待人也非常友善,(但)有的時候你跟他談起來計(jì)算機(jī)強(qiáng),他就跟你翻臉?!?/p> 也有人困惑。理智的言辭是“不要盲目崇拜”。過激的話也有。有的棋手在時過半年后,還認(rèn)為AlphaGo和李世石的人機(jī)大戰(zhàn)是“做了一個局”。 有一部分棋手迅速臣服,擁抱AI。第一盤比賽后,張大勇問韓國棋手金志錫九段:機(jī)器棋力怎么樣?金直接擺了兩個子。在職業(yè)棋界,傳統(tǒng)規(guī)矩是每三個段位讓一子。讓兩子就意味著職業(yè)九段面對職業(yè)初級水平,“相當(dāng)于跑百米,他先讓跑20米似的”。 正在北京大學(xué)哲學(xué)系讀書的李喆六段發(fā)表了三篇與人機(jī)大戰(zhàn)有關(guān)的文章,其中第二盤戰(zhàn)罷后的《這兩盤棋沒有人會比李世石做得更好》,閱讀量的后臺數(shù)據(jù)是30多萬,達(dá)到歷史之最。 李世石在于AlphaGo的對決中以失利告終 看第二盤棋棋譜,李喆哭了。 “我確實(shí)從來沒有因?yàn)槠蹇捱^,基本上輸棋也沒有哭過,更沒有看到棋譜哭?!币徊郊鐩_,以及后面的一系列走法,當(dāng)時大家都認(rèn)為AlphaGo虧了,但最后它贏了,“贏得漂亮”。 “那步肩沖我認(rèn)為展現(xiàn)出來說明AI已經(jīng)有了所謂的’創(chuàng)造性’,不是機(jī)器本身的創(chuàng)造,而是它下出來的東西,幾乎是經(jīng)驗(yàn)之外的,雖然我們下過這步棋,但不是在這樣的情況之下,……他的這個肩沖,用俗一點(diǎn)的話就是超越時代的,我們這個時代可能下不出來這個棋?!?/p> 他形容當(dāng)時的感受:“很震撼”,“就好像一個畫家看到一個一百年后的藝術(shù)品。” “你說他超越了時代,但他在這個時代出現(xiàn)了,那他豈不是創(chuàng)造了一個時代?” “對,是這樣的。圍棋現(xiàn)在已經(jīng)進(jìn)入了智能圍棋的時代?!?/p> 李喆在日后的一篇文章中說,“人工智能,在迄今為止的工具進(jìn)化史中,它的出現(xiàn)很晚。越晚出現(xiàn)的工具,力量通常會越強(qiáng),人們對它的迷戀和恐懼也會越大。” 怪獸長成記 2017年3月18日,日本東京電氣通信大學(xué)。 加藤英樹是UEC杯比賽會場上最忙碌的人。他是年紀(jì)最大的“參賽者”,要會友、社交、教徒、受訪,還義務(wù)承擔(dān)一些順便的會務(wù)工作。 樸廷桓和DeepZenGo的研發(fā)者加藤英樹 UEC杯是日本電氣通信大學(xué)主辦的機(jī)器圍棋比賽,到2017年已經(jīng)10屆。在AlphaGo降臨之前,這里是圍棋AI最前沿的陣地。加藤英樹是日本最強(qiáng)AI圍棋DeepZenGo的代表,按照他的劃分,1984到2005年,AI圍棋走過漫長的古典時代,人類將自己對圍棋的理解,平移到AI圍棋中,由于變化太多,邏輯復(fù)雜,這樣的平移成果很差。隨著2006年蒙特卡洛樹搜索的出現(xiàn),Zen誕生,UEC杯開辦,見證了AI圍棋急劇發(fā)展的時期。2016年DeepMind發(fā)表論文,AI圍棋進(jìn)入AlphaGo時代。AlphaGo的原理中既包含蒙特卡洛樹搜索,又增加了政策網(wǎng)絡(luò)和價值網(wǎng)絡(luò)兩個通過自我學(xué)習(xí)而構(gòu)建起的神經(jīng)網(wǎng)絡(luò),使得機(jī)器棋力突破職業(yè)水平的瓶頸,并以幾何倍的速度日益進(jìn)化。去年Zen受AlphaGo影響升級為DeepZenGo,實(shí)力亦大為增長。 末代UEC杯開賽。從明年起,比賽將更換主辦方。 比賽的場面很松弛,程序員們穿著休閑裝,正式開賽以后便把時間都交給機(jī)器,主人們?nèi)齻z倆聚在一起聊天。 “這個圈子本來是很和氣的一個圈子,不過今年變成兩大怪獸對決。”來自臺灣的旅日棋手王銘琬九段在與其他人交談時說道,“那種感覺就是一個小村子的角力比賽,兩大怪獸突然跑進(jìn)來參賽。”往年機(jī)器賽畢會接受職業(yè)棋士指導(dǎo)一盤,而今年的冠亞軍決出后幾乎是以指導(dǎo)的姿態(tài)去跟職業(yè)棋手下?!?/p> “(過去跟現(xiàn)在)完全是兩回事?!?/p> 大概在六七年前,王銘琬擔(dān)任UEC杯裁判長,那時候他最大的任務(wù),是在機(jī)器中途停掉“不知道要怎么辦”時,去評判誰贏誰輸——就像踢足球踢不到90分鐘就沒體力踢下去了。 對于半途而廢局面勝負(fù)評判的爭議,大家通常不太在乎。 “參加這個棋賽的選手,大家都是同志,不是敵人。大家都為了提升電腦圍棋,往一個目標(biāo)去努力?!蓖蹉戠f。 加藤在現(xiàn)場指導(dǎo)初來參賽的大學(xué)生程序員也體現(xiàn)出這樣的意味。今天強(qiáng)大的“怪獸”也是笨拙的過往積累出來的,即便在去年,Zen還需要被讓三個子。今年實(shí)現(xiàn)互先,并互有勝負(fù)。 雷米-庫倫和黃士杰 將蒙特卡洛樹搜索用于圍棋程序的先驅(qū)、法國人雷米-庫倫(RémiCoulom)今年的成績不佳,只得到第五。 雷米是AjaHuang的老師,AjaHuang是AlphaGo論文并列第一作者,AlphaGo的人肉臂黃士杰博士。 雷米稱對自己的成績早有預(yù)料,因?yàn)闆]有用GPU(圖形處理器GraphicsProcessingUnit的縮寫)。 “我的大部分業(yè)務(wù)還是售賣手機(jī)應(yīng)用,手機(jī)上可沒有GPU,所以我還是要將精力集中在不使用GPU的情況下,如何讓軟件變得更強(qiáng)?!?2歲的法國人說,“也許是因?yàn)槲易兝狭耍野l(fā)現(xiàn)我對于激烈的競爭沒有那么大的動力。我們會繼續(xù)精進(jìn)瘋石,但我這么做是出于樂趣?!?/p> 剛聽說AlphaGo的消息時,他為Aja感到高興,但同時也有一點(diǎn)難過,“因?yàn)檫@是一種終結(jié)……十年來,打敗職業(yè)棋手一直是一個令人興奮的目標(biāo)?,F(xiàn)在這一切都終結(jié)了。但是,沒關(guān)系,我可以把注意力轉(zhuǎn)移到其他項(xiàng)目上。” 可能是語言的緣故,也可能出于靦腆,談話間他會有很多躊躇。尤其是在被問到與Aja如今的聯(lián)系時,雷米說,“是的,我們有聯(lián)系,但是你知道,他們公司對員工對外交流控制得很嚴(yán)……有時候我會問他問題,他會說,’啊……可能……也許……’他啥也不能說?!?/p> 這是獨(dú)立開發(fā)者和大公司員工之間的距離。 “新技術(shù)需要強(qiáng)大的計(jì)算力,所以我想大公司能夠動用龐大的計(jì)算力,而我沒有這樣的途徑。所以……作為一個個人研究者,現(xiàn)在已無力與大公司抗衡,但是,不管怎樣,在計(jì)算機(jī)游戲的歷史上,有的時候有好的想法比擁有強(qiáng)大的硬件要更重要。能夠冒出好的想法依然還是讓人心潮澎湃?!?/p> 曾經(jīng)在AI圍棋界處于頭號地位的Zen,是由尾島陽兒和加藤英樹兩人自主開發(fā)。加藤10年前因過勞而患抑郁癥,辭職后靠政府的殘障年金過日子。遵醫(yī)囑的話,他每天只能工作3到4小時。但從UEC杯到接下來大阪舉辦的最強(qiáng)棋士戰(zhàn)(中日韓棋手羋昱廷、井山裕太、樸廷桓迎戰(zhàn)DeepZenGo),63歲的老人家要連軸轉(zhuǎn)。如今DeepZen的研發(fā)經(jīng)費(fèi)還是出自尾島和加藤個人,加藤的經(jīng)濟(jì)收入主要來自講演和熱心人士捐助,加上早年研究所時代的積蓄。去年因AlphaGo帶熱人工智能而加入Zen團(tuán)隊(duì)工作的DOWANGO,主要負(fù)責(zé)向兩位研發(fā)者提供服務(wù)器。 抑郁癥給加藤造成身體的損害是不可逆的,“腦子中有部分組織半永久不可復(fù)元了,血清素不足,神經(jīng)傳導(dǎo)受限,所以容易誘發(fā)睡眠障礙,一過勞就會暈倒?!奔犹匍_玩笑說,人工智能火了之后,自己也成了人氣明星,因?yàn)閆en,他的工作紛至沓來,簡直“像藝人一樣”,嗔怪Zen“真是一個耍得父母團(tuán)團(tuán)轉(zhuǎn)的孩子??!” 從入行以來,加藤的動力始終沒變,“人工智能研發(fā)至今都還沒有大腦——我想給它植入一個!給圍棋軟件,植入一個真正意義上的聰明的大腦,這是我最初開始研發(fā)圍棋人工智能的理由之一。標(biāo)準(zhǔn)19路的圍棋很難,很難擊敗專業(yè)棋手,但AlphaGo在我沒有想像到的,在ZEN的短板處增強(qiáng)了研發(fā),擊敗了職業(yè)棋手,老實(shí)說,我很困惑?!?/p> “在我們IT或者計(jì)算機(jī)科學(xué)領(lǐng)域里面,毫無例外,重要的工作都是由公司來做?!比斯ぶ悄軐<摇⒈本┼]電大學(xué)教授劉知青說。他同時是北郵九鼎計(jì)算機(jī)圍棋研究所所長。 在程序世界里,存在著成千上萬種編程語言,真正走進(jìn)大眾生活的,都是大公司出品,比如C++是貝爾實(shí)驗(yàn)室的,JAVA是甲骨文的,Windows是微軟的……大學(xué)里的研究組也做,但影響都不及人們耳熟能詳?shù)倪@些產(chǎn)品,“因?yàn)檫@些東西除了科學(xué)上的進(jìn)步之外,……它要數(shù)據(jù)的準(zhǔn)備,它要計(jì)算資源,……大量的機(jī)器、人員、資金,方方面面的投入?!?/p> 說到底,計(jì)算機(jī)科學(xué)不像數(shù)學(xué)領(lǐng)域,“證明”即達(dá)成。計(jì)算機(jī)科學(xué)始終要面對工程和效率的問題。在怪物養(yǎng)成記背后,是程序員個人選擇的合集。 劉知青在紐約大學(xué)念書時,親眼目睹了兩種選擇下的人生道路。有的全職終身教授放棄了教職,去了貝爾實(shí)驗(yàn)室,“他們愿意在大的團(tuán)隊(duì)里面,做出一個更有影響的事情?!币灿械娜藞?jiān)持留在大學(xué)里,做一般公司不太做的初期創(chuàng)新,這里包含了研究的自由。 “最早的蒙特卡洛的方法,神經(jīng)網(wǎng)絡(luò)的方法,都是大學(xué)的研究團(tuán)隊(duì)來做的,并不是公司來做。只是當(dāng)這些東西相對成熟了,那么大公司就把它拿來,做成一個有影響力的產(chǎn)品?!眲⒅嗾f。 隨著UEC杯的落幕,我與雷米談起他對這個比賽最美好的記憶。他說:“我得過4次冠軍。每次獲勝都是很美好的記憶。事實(shí)上,我人生第一次來日本也是因?yàn)閁EC杯主辦者的邀請,多虧了UEC杯,我才能來日本,現(xiàn)在也和日本人做生意。我印象深刻的是,我第一次來日本。此前我從未到過亞洲。我生在法國。那是2007年(我來到日本),就好像發(fā)現(xiàn)了一個嶄新的星球一樣?!?/p> 數(shù)與道的轉(zhuǎn)化 2015年,樊麾結(jié)束歐洲圍棋大會后回到在法國的家。他收到一封郵件,英文的。他英文不好,一般這樣的郵件會遭到無視。但誰知道為什么,他讀了這封來自英國的郵件。 郵件說,我們是一家倫敦的公司,想邀請你來看一看。樊麾跟他們開了線上會議,上網(wǎng)搜了公司主頁,看到了上面有圍棋,說服自己相信收到了一個真實(shí)的邀請。 英國人告訴這位早年在中國成為職業(yè)二段后遠(yuǎn)渡重洋在法國為圍棋開枝散葉的棋手、教練,希望他輔助他們研究機(jī)器圍棋。樊麾一度設(shè)想自己會渾身插滿設(shè)備,用以導(dǎo)出下棋時的思考方式。 而最終他要做的非常簡單:跟程序下棋。他很輕松地說,要一個小時就夠了。 2015年10月,正在與AlphaGo苦戰(zhàn)當(dāng)中的樊麾(右一)。 他第一次跟機(jī)器下棋在2005年的法國。一開始機(jī)器運(yùn)轉(zhuǎn)的聲音很平緩,對弈時,機(jī)器的響聲變得劇烈起來,聽上去仿佛真的有腦漿在翻滾在思考。到了2015年,他以為,類似的經(jīng)驗(yàn),平移到英國,就可以。 在他的概念里,人類棋手強(qiáng)于全局觀,能用組織化的思維看待各個要素,所以在與AlphaGo的第一局比賽時,“我下得很有全局觀,下得很慢,不急于進(jìn)攻。”對局中,他漸漸發(fā)現(xiàn),AlphaGo要的,跟他一樣。 比賽的結(jié)果全世界都知道了,5:0,AlphaGo完勝。 跟AlphaGo對弈之后,“我內(nèi)心的圍棋世界坍塌了”。其后樊麾參加一項(xiàng)重要的歐洲比賽,每局45分鐘的時限,加上被AlphaGo沉重打擊的內(nèi)心,他幾乎沒有信心參賽。 “但非常奇怪的事情發(fā)生了——我贏了所有的比賽,非常輕易的。我努力想要弄清楚到底發(fā)生了什么。我看到我和AlphaGo的比賽,找到了一個新的視角來看我自己的比賽?!?/p> 樊麾在波士頓大學(xué)演講時道出了自己的故事。 “當(dāng)你學(xué)圍棋的時候,你學(xué)的第一件事是定式、布局,好的方向,好的形狀。第二步就是怎么樣最好地利用這些形狀。但這些還遠(yuǎn)遠(yuǎn)不夠。如果你想打敗大師,你必須忘記你之前學(xué)的所有的東西。因?yàn)槟銓W(xué)的所有東西都像一個籠子一樣,把你關(guān)在里面……你想的是定式是什么,布局是什么,有時你忘了如何才能讓這些棋子聯(lián)合生效,這就是為什么,當(dāng)我和AlphaGo比完賽之后,我覺得世界坍塌了,但同時建立起了新的東西,現(xiàn)在我下起棋來完全自由了?!?/p> 這個自由的故事為他贏得了掌聲。他在AlphaGo的V18版本中經(jīng)歷和思考的,世界頂級棋手們在V25及此后的版本中,逐漸體味。 “最開始看到當(dāng)然覺得不能理解,覺得不知道好在哪。但是他就在你不知道他哪里好的時候他就贏了。所以再多看了一些之后,雖然你不理解他好在哪,但他就是這么下就可以贏。所以你就想辦法慢慢去理解唄。越來越感受到他的強(qiáng)。”周睿羊九段說,“一開始感覺很難接受這個東西,但是越來越覺得自己理解得太淺太淺了,對圍棋的理解。越來越覺得自己還是太弱。” 國際象棋領(lǐng)域很早就引入計(jì)算機(jī)輔助棋手訓(xùn)練,計(jì)算機(jī)的棋力早已做到可以讓職業(yè)高手一馬。從項(xiàng)目本身的復(fù)雜程度來說,國際象棋要稍遜于圍棋,因此對于定式和原則的限定會更明確,在這樣的背景下,被計(jì)算機(jī)攻破職業(yè)堡壘后,人與機(jī)器達(dá)到接受與融合,部分定式廢止,公認(rèn)的和棋被推翻,人類的棋力也得到大幅提高。 某種程度上,國際象棋已經(jīng)成為圍棋的前車之鑒。 顛覆會帶來震蕩,認(rèn)知上的震蕩,表面不彰,內(nèi)心翻滾澎湃。 “這個我倒不覺得是打擊,我倒覺得是挺興奮的一個事情,這太有趣了。如果沒有它的話,我們可能一百年之后,一上來還不敢用點(diǎn)三三。其實(shí)它點(diǎn)三三之后我們都明白它為什么點(diǎn)三三,它不扳粘,它是有它的很明顯的道理的,但是由于我們的慣性思維,點(diǎn)三三之后一定會扳粘的,習(xí)慣了,那樣的話我們就不會去點(diǎn)三三?!崩顔戳握f。開局不久點(diǎn)三三已經(jīng)成為多位職業(yè)棋手在大賽中嘗試運(yùn)用的新招法。 三-三是指從棋盤邊線開始數(shù),向里橫向第三行,縱向第三列的交叉點(diǎn)。人機(jī)大戰(zhàn)首局,柯潔執(zhí)黑在第3手和第7手連續(xù)搶占兩個三-三。 “我覺得很有意思的是,我之前有一個同學(xué)拍了一個畢業(yè)作品,是講的吳清源和秀哉的那盤棋,里面引用了一句話,三三的弱點(diǎn)是星位,星位的弱點(diǎn)是三三,現(xiàn)在Master或者是AlphaGo很好地去證明了這一點(diǎn)。因?yàn)橐郧爸v星位的弱點(diǎn)是三三,更多的意思是抽象的,腳步很空虛,不踏實(shí)的。但是現(xiàn)在三三可以直接肩沖,星位可以直接點(diǎn)三三,但是并不能證明星位和三三就不好了。這其實(shí)是一個很辯證的東西,很有意思。我覺得圍棋里充滿了這樣的東西?!?/p> “研究機(jī)器的招法的樂趣在于什么?” “研究機(jī)器的招法的樂趣在于把它轉(zhuǎn)化成我能理解的思維方式?!?/p> 李喆在此前做了七路圍棋研究,整個棋盤全部算清,一比較就知道下哪個點(diǎn)。到十九路圍棋,人已經(jīng)算不清了,“我們就說這個地方是厚還是薄,這個地方是虛還是實(shí),我用什么樣的策略。” “人工智能體現(xiàn)出來的其實(shí)更趨近于第一種思路,雖然它也達(dá)不到窮盡,但它還是基于數(shù)的一種,最后是勝率的比較。”總之,“在能夠用數(shù)學(xué)達(dá)到的地方,就用數(shù)學(xué)去達(dá)到它,我們在數(shù)學(xué)達(dá)不到的地方,我們用道的方式來理解,道理的方式更模糊,但是更具有普遍性,認(rèn)識圍棋也是這樣。”人工智能本身不是在創(chuàng)造,它只是一個算法,但作為接收方,我們以人的方式理解,這就構(gòu)成了“數(shù)和道的對話”,“用我們的道理的方式理解它的創(chuàng)造性,就會變成我們自己的吸收,我覺得這個是非常非常有意義的事情。” “人是沒有出路的” 2016年11月。 60歲的日本棋手趙治勛九段對DeepZenGo的電王戰(zhàn)中,DeepZen顯示勝率超過50%的情況下,加藤代表主動認(rèn)負(fù),引起爭議。 “一般來說是將勝率預(yù)測設(shè)定在某一特定數(shù)值,比方說30%(低于30%則機(jī)器認(rèn)負(fù))。但如果在勝率預(yù)測40%的時候,我感覺盤面比較艱難,也會武斷地決定投子認(rèn)輸。這種靈活的判斷,還是只有人類能做,機(jī)器不靈......所以基本上是由我來作出判斷的?!傊?,認(rèn)輸這件事,目前還是需要研發(fā)團(tuán)隊(duì)來作出判斷,而不是交給AI圍棋本身。我聽說AlphaGo的這個數(shù)值是10%,我不太喜歡這個,這里還是有文化差異的吧,日本和歐美對圍棋文化的理解不同。在日本,有’玷污棋譜’一說,如果最后的棋型走得很奇怪的話,對圍棋是一種褻瀆。日本有這樣的傳統(tǒng)?!?/p> 對此,劉知青則表示反對,“我覺得把它中斷下來是不合適的,因?yàn)槲易鳛橐粋€科研人員來看它,這是一個測試過程,我希望能夠展現(xiàn)它的弱點(diǎn)是什么。加藤把它停下來了,其實(shí)是阻礙它的弱點(diǎn)的暴露?!?/p> 另有觀點(diǎn)認(rèn)為,加藤替機(jī)器做決定,可能使機(jī)器喪失原本運(yùn)籌的取勝機(jī)會。加藤也承認(rèn),自己電王戰(zhàn)時意識還停留在機(jī)器水平大幅落后于人類棋手時期,認(rèn)為死磨硬泡等待對手犯錯與玷污棋譜無異,“現(xiàn)在回過頭來,我覺得那個時候,就有必要修改認(rèn)輸機(jī)制了——因?yàn)榈搅嘶ハ龋闶强梢缘却龑Ψ匠鲥e的,這沒有關(guān)系。然而我當(dāng)時并沒意識到。……(不過)有這種(原本勝機(jī)喪失掉)可能也沒有什么。本來就是研發(fā)者在承擔(dān)所有的責(zé)任。比方說,如果在對弈過程中,程序出現(xiàn)BUG,然后AI圍棋輸了,這些責(zé)任都是研發(fā)者在承擔(dān)。最后的認(rèn)輸判斷也不例外。說到底,一切交由AI,也是研發(fā)者作出的判斷?!?/p> 劉知青反對:“你沒有決定權(quán),當(dāng)它下棋的時候,你已經(jīng)沒有決定權(quán)了”“你替他認(rèn)輸,真是有悖于科學(xué)的道理,……你要看AlphaGo被李世石擊敗的時候,它是怎么下荒唐棋的,這個是我們?yōu)閿?shù)不多的一個機(jī)會見到這件事,你不讓它(繼續(xù)下),怎么辦?” 科學(xué)精神、人類的自主權(quán),人對工具的態(tài)度,與工具的關(guān)系,與自我和認(rèn)知緊密相聯(lián)。 有人工智能專家曾經(jīng)預(yù)言,如果制造出能戰(zhàn)勝職業(yè)棋手的國際象棋AI,那么后者一定具備從戰(zhàn)略素養(yǎng)到戰(zhàn)術(shù)能力的全方位的強(qiáng)人工智能。事情并未這樣發(fā)展,但結(jié)果是人類收獲了足以輔佐其棋藝精進(jìn)的機(jī)器。 跟國際象棋AI類似,圍棋AI并非從人類總結(jié)出的棋理邏輯出發(fā)來構(gòu)建,而是將人下棋的過程,拆解出大量的對弈積累(政策網(wǎng)絡(luò)),識別形狀的好壞(價值網(wǎng)絡(luò)),對變化的可能性進(jìn)行有效篩選剪枝后隨機(jī)搜索驗(yàn)證(蒙特卡洛樹搜索),得出人看來最優(yōu)化的一步(勝率最高)落子。 “AlphaGo(圍棋行為的輸入和輸出)的過程,它也可以更好地揭示了人下圍棋的過程?!眲⒅嗾f,這反過來讓我們“對于人類思考的一種方式,可能有個更深的、更本質(zhì)的理解,我覺得這個意義上可能更重大一點(diǎn)?!?jīng)認(rèn)為圍棋就是一個神圣的東西,其實(shí)它不是,或者說認(rèn)為我們大腦思維是一種神圣的東西,其實(shí)也不是,它是一個神經(jīng)系統(tǒng)的物理過程,但可能超出了普通的認(rèn)識,但是也不是一個不可超越的或者是神秘的過程,現(xiàn)在我們可以看到,所有的這些物理過程都不是神秘的,我們有更好的認(rèn)識,而且是可以復(fù)制他們的,而且可以超越他們的?!?/p> 這樣的認(rèn)知、復(fù)制和超越的過程,使得人工智能由弱變強(qiáng),終極問題隨之誕生:最終人工智能會導(dǎo)向何種歸宿呢? 樂觀的觀點(diǎn)是工具強(qiáng)大且受人控制,為人服務(wù)。悲觀的如特斯拉的老板ElonMusk,他認(rèn)為最好的情況是,人成為機(jī)器的寵物。霍金也對人類未來的掌控權(quán)擔(dān)憂。 “我覺得首先這個東西好壞不講,這個趨勢是必然的,就是說這個是必然的方向,無論好壞?!眲⒅嗾J(rèn)為,縱然前途未知,人類卻仍然會將人工智能發(fā)展下去,并承擔(dān)好與壞可能性的并存。 “人必須要做。因?yàn)槿艘偁帯D愀偁幘偷美眠@個東西,除非你不競爭了,你說我放棄,沒有人愿意放棄,你要競爭,你必須要做這個事情,除非你說跟我無關(guān),我這人放棄了,但是只要你想競爭,你必須要利用機(jī)器,你利用這個機(jī)器的時候,你就要促進(jìn)它的發(fā)展,這個機(jī)器肯定會越來越強(qiáng),這個與你一直無關(guān)嗎?” “其實(shí)是人性促使了這個東西?” “是的。人是沒有出路的?!嗽诮柚@樣的工具,你沒有辦法(避免爭奪掌控權(quán))?!?/p> 人類親手為自己開創(chuàng)了一個未知的結(jié)局。在劉知清看來,意義更多地落于奔向這個結(jié)局的過程:“我們是通過人工智能的研究,通過機(jī)器的發(fā)展,也是認(rèn)識人的局限性、人的能量、人的地位,其實(shí)都是認(rèn)識我們自己,認(rèn)識到我們自己?!?/p> 自由的人 從小下棋,國家隊(duì)10年,有個問題一直困惑著李喆——下棋的社會意義是什么?父母親是醫(yī)生、教師,他們的社會意義很好理解。棋手成天下棋,為了什么?追尋棋道嗎?那么,棋道又是什么?是勝負(fù)嗎?當(dāng)一位棋手年紀(jì)漸長,反應(yīng)速度變慢,計(jì)算力下降,無法在現(xiàn)有的競技體系中獲取勝利了,那他(她)追求的就不是棋道了嗎? 李喆跟時越、樸文垚等棋手朋友探討過這個問題,沒誰說得清。他去看書找答案,獲得一些啟發(fā),但難以系統(tǒng)。所以,當(dāng)讀大學(xué)的機(jī)會降臨時,他毫不猶豫地選擇暫別競技體系,那時他的等級分排在全國前三,距離世界冠軍并不遠(yuǎn)。 AlphaGo的降臨成為棋手參悟圍棋、理解自身與社會關(guān)系的重大機(jī)會。 “我們對于圍棋的認(rèn)識有了更趨近真理的方法,之前從來不知道我們對圍棋的認(rèn)識到底達(dá)到一個什么程度,有了這個之后,可能有了更好的參照,有更好的幫助我們?nèi)ダ斫狻!崩顔凑f。 AlphaGo是用強(qiáng)大到深不可測的棋力來給人們提供參照的。 “AlphaGo的棋風(fēng)可能是千變?nèi)f化的,沒有什么是它的棋風(fēng)。它沒有棋風(fēng),隨心(所欲)?!敝茴Q蛘f,“看到它樸實(shí)地下,就可以贏,就是美啊?!?/p> “對你來說,它是一個棋手嗎?” “當(dāng)然……是。對于我們現(xiàn)在來說,它就是神?!?/p> 羅洗河九段受邀參與人工智能圍棋的研制和測試時,旁人為了增加產(chǎn)品與工作人員的親近感,說,我們把產(chǎn)品當(dāng)孩子一樣養(yǎng)大吧。羅洗河說,我不這么認(rèn)為,“我就是在造神”。一年多的工作下來,羅說,“造神是無法求證的理想。不斷的更近一些也是很美妙的。” 跟很多棋手的感知相反,圍棋AI給王銘琬的啟示是,“不用那么懷疑自己”,“其實(shí)我個人下棋一開始還是蠻有用概率性的想法去下?!?/p> 這位本因坊戰(zhàn)、王座戰(zhàn)、日本大師賽冠軍,圈中人稱“怪腕”的棋手說,“因?yàn)槲冶旧聿⒉皇悄欠N一流的棋手,運(yùn)氣好的時候拿一兩個頭銜。我跟柯潔、趙治勛一開始就站在不一樣的地方在看這個圍棋。柯潔是以下贏為目的,而我只覺得,下完了……只要好玩就好了?!瓏咫娔X到現(xiàn)在并沒有告訴人到現(xiàn)在人對圍棋的看法和研究是沒有用的,正好是相反,這個方向是沒錯的……以前自己對這個方向的努力還不夠?!?/p> 在王銘琬看來,“圍棋的目的不是為了打敗對方,而是雙方共同創(chuàng)出的一個時間跟作品。從這個方面來說,電腦打敗人類,是讓人類回歸原點(diǎn)。”勝負(fù)只是一個人為的機(jī)制,“說人類很注重勝負(fù)只是因?yàn)樗菀讏蟮?,容易理解,并不是說人類真的只喜歡勝負(fù),要是脫離了勝負(fù)這個桎梏、枷鎖的話,說不定會有更自由的發(fā)揮,是(我)自己抱有的看法。” 圍棋傳媒有個經(jīng)典問題:如果有“圍棋上帝”,你認(rèn)為自己跟祂有多大差距? 在AlphaGo出現(xiàn)之后,棋手們對這個問題的答案有了更謙遜,同時又包含更多可能性的回答和思考。 正在與DeepzenGo對弈的趙治勛(右) “人很難去評判有沒有上帝這回事。但上帝,確實(shí)是遲遲不肯露臉的那個存在,不肯跟我們?nèi)祟惼迨忠黄鹎写?,一切喝酒聊天。但AI出來了,至少在形式上是看得見摸得著的。它比人類更強(qiáng)大,比李世石、柯潔更強(qiáng)大,成了一種類似上帝般的存在,然后我們?nèi)祟悶榱私咏?,努力去追趕去超越。這跟從前不一樣的。從前的話,一旦成了人類中的最強(qiáng)棋手,就會以為老子天下第一,不得了了。但現(xiàn)在,AI來襲!它或許就是上帝的化身,是看得見摸得著的上帝。而因?yàn)榭吹靡姡覀內(nèi)祟惼迨秩タ拷?。從前看不見,所以人類就在那里坐等著。在未來的圍棋世界,就算你達(dá)到人類棋手之最了,你未必是圍棋世界之最,就會激發(fā)起你的上進(jìn)心。而不像從前,自以為老子天下第一,你會變得謙卑,用心精進(jìn)。這,我覺得實(shí)在太有趣了!”韓國旅日的超一流棋手、日本棋戰(zhàn)獲頭銜次數(shù)最多的棋手趙治勛九段說。 作為一個傳奇人物,他在當(dāng)下最傳奇的事情莫過于,沒有手機(jī)。 “在日本,沒有手機(jī)的恐怕也只有我一個了(笑)。因?yàn)槲也粫謾C(jī),對我純屬浪費(fèi)。” 這個沒有通訊工具的人,我們只有在棋賽上才得一見。在3月日本大阪舉行的最強(qiáng)棋士戰(zhàn)中,趙治勛出任裁判長。循慣例,日本大賽會舉行前夜祭。標(biāo)志性的蓬亂的頭發(fā),紅潤的面色,趙治勛在舞臺中央妙語連珠,活像得到了落語大師的真?zhèn)?。前夜祭上每個人都著正裝出席,加藤英樹先生也脫下圍棋AI大賽上的休閑打扮,換上筆挺光鮮的西裝。 在性質(zhì)不同的比賽中快速切換,讓人難免有恍惚之感。世界似乎越來越大,在思維層面上,我們擁有不斷被解放出來的自由。 “如果可以選擇,您更愿意做很老實(shí)但很少犯錯無懈可擊不知疲倦的AI圍棋棋手,還是很狡猾但會犯錯的人類棋手?”這個問題只提給過老頑童趙治勛。 “我寧愿當(dāng)個人,下棋有輸?shù)臅r候,也有贏的時候。輸棋的時候我總會非常非常悲傷,簡直就是世界末日。但正因?yàn)檫@樣,所以贏棋時的快樂,就是百倍的。而如果是一直贏下去,永遠(yuǎn)不會輸?shù)脑?,恐怕太無趣了。所以我想當(dāng)人?!壁w治勛說。 他還擁有著為人的任性。在嚴(yán)肅闡述了AlphaGo的強(qiáng)大之后,他說,“如果代表人類出戰(zhàn)的是柯潔,我相信他將百分百戰(zhàn)勝AI圍棋?!崩碛梢彩前俜职偃说睦碛?,“我堅(jiān)信柯潔能贏。因?yàn)槲腋P(guān)系很好。這不是玩笑話??聺嵅?9歲。我從前也有過一陣棋力還算強(qiáng)的時候。按道理說,柯潔不可能知道我,可是在某些聚會中見面,他都會主動跟我打招呼,向我問好,我非常非常開心!真的。我一直以為他不可能知道我這個人的......我是柯潔的粉絲!” 而在昨天的第一局較量后,執(zhí)黑以1/4子惜敗的柯潔表示:“(自己)輸?shù)脹]什么脾氣?!薄?/p> (楊昕雨對本文亦有貢獻(xiàn)。感謝常昊、周睿羊、李喆、劉知青、華學(xué)明、張大勇、謝銳、王煜輝、房學(xué)峰、王平、加藤英樹、羋昱廷、趙治勛、王銘琬、俞斌、馬林、羅洗河、雷米-庫倫受訪) |
|