全網(wǎng)首發(fā)·精選筆記·人工智能 本文優(yōu)質(zhì)度:★★★★★ 口感:奶酪魚 筆記君邀您,閱讀前先思考:
以下,盡情享用~ 一、寫書的初衷 市場上有很多關(guān)于人工智能的書。各種觀點(diǎn)包括2040年奇點(diǎn)降臨,機(jī)器人要終結(jié)人類的演化歷史等等。包括馬斯克、霍金這樣的大咖也在發(fā)出很擔(dān)心的聲音。 大家為什么會(huì)對(duì)人工智能有這么多不同的理解呢?就因?yàn)樗苌衩亍?/span> 不像互聯(lián)網(wǎng)來臨時(shí)大家都能懂,互聯(lián)網(wǎng)企業(yè)就是不同的商業(yè)模式,技術(shù)也比較簡單。但人工智能就好像是個(gè)黑科技。 我就想寫一本書,把黑科技給它祛魅。從我自己的研究看,人工智能背后的東西都是很簡單的。 人工智能對(duì)我的刺激,是從AlphaGo下圍棋這件事開始的。 這件事給我們?nèi)祟悗韮蓚€(gè)震撼: 第一個(gè)震撼是我們完全無法理解為什么AlphaGo能這么厲害。 柯潔下完后流著眼淚說:“我根本看不到希望?!甭櫺l(wèi)平說:“AlphaGo是上帝派來教人類下圍棋的,它的水平至少是20段。” 不僅柯潔和聶衛(wèi)平不懂,連谷歌的工程師都搞不明白為什么AlphaGo每一步會(huì)這么走。要知道圍棋在人類世界里被認(rèn)為是最高智商的游戲。但我們卻被人工智能打得沒有還手之力。 但最震撼的是AlphaGo要先學(xué)人類的殘局、學(xué)棋譜,然后超過人類。但AlphaZero不學(xué)人類的棋譜,完全靠機(jī)器的自我對(duì)弈、自我學(xué)習(xí),結(jié)果7天就打敗了AlphaGo,40天以后就天下無敵。 這說明人類2000年積累的圍棋知識(shí),對(duì)AlphaZero不僅一錢不值,反而是累贅和包袱,反而束縛了它的水平。 這件事對(duì)我們自尊心的打擊太大了。人類覺得圍棋殘局多么牛的東西,居然對(duì)機(jī)器來說是垃圾。人類積累了2000年的東西,對(duì)于機(jī)器來說是垃圾。 這件事對(duì)我自己也是非常大的沖擊。整本書研究的起點(diǎn)就從這里開始。 二、無法理解人工智能 是基本概念出了問題 2018年年底,AlphaGo團(tuán)隊(duì)做出了阿法蝶(疊)。我把它翻譯成蝶,正好是阿法狗的妹妹。 阿法蝶可以把蛋白質(zhì)基因序列的蛋白質(zhì)三維結(jié)構(gòu)給算出來。這個(gè)研究結(jié)果被發(fā)表在《科學(xué)》雜志上。 人類的生命,都是由細(xì)胞組成的。細(xì)胞的基本單位就是蛋白質(zhì)。蛋白質(zhì)的三維結(jié)構(gòu)非常復(fù)雜,而蛋白質(zhì)的所有功能就取決于三維結(jié)構(gòu)。 以制藥舉例。 比如找到了一種造成肝癌的蛋白質(zhì),要能發(fā)現(xiàn)小分子卡在這個(gè)蛋白質(zhì)的三維結(jié)構(gòu)里,讓它動(dòng)彈不了,肝癌就能治好。 所以蛋白質(zhì)結(jié)構(gòu)是人類理解基本的生命和生命過程最重要的東西。 過去人們觀測蛋白質(zhì)的三維結(jié)構(gòu)要用X光衍射的方法,非常非常的難。做好幾年的試驗(yàn),都可能看不到一個(gè)(完整的結(jié)構(gòu))而且蛋白質(zhì)特別容易脆。 這兩年出了新儀器叫冷凍電鏡,但需要1000萬美金一臺(tái)。 在冷凍電鏡下,比較容易看到三維結(jié)構(gòu),但冷凍電鏡要做出一張蛋白質(zhì)三維結(jié)構(gòu)圖,要照幾十萬張照片,再拼湊出來。但現(xiàn)在阿法蝶(疊)很輕松就算出來了。 借助人工智能,我們?nèi)祟愒诨A(chǔ)科學(xué)上,有了巨大的突破。 ▲ 長按圖片保存可分享至朋友圈 于是我給出一組定義: 信息:可觀察的事物表征 數(shù)據(jù):被描述出來的信息 知識(shí):數(shù)據(jù)之間的關(guān)系 我認(rèn)為這三個(gè)定義是自洽的,簡單的。用這個(gè)定義來解釋人工智能是非常嚴(yán)謹(jǐn),后面我會(huì)詳細(xì)介紹。 三、人是否能可靠的認(rèn)知世界? 做人工智能研究,我有一個(gè)線索是回到人類認(rèn)識(shí)世界的最初。哲學(xué)上有一個(gè)分支叫認(rèn)識(shí)論。 認(rèn)識(shí)論討論的是世界的本源是什么,人是否能可靠的認(rèn)識(shí)世界? 理性主義認(rèn)為: 人是有能力認(rèn)知概念的,比如時(shí)間、空間; 知識(shí)是來自于推理; 萬事皆有因果。 而經(jīng)驗(yàn)主義的代表人物洛克認(rèn)為: 人天生就是白紙一張,所有的知識(shí)都來自于經(jīng)驗(yàn),萬事沒有因果關(guān)系,因果關(guān)系只是假象,其實(shí)就是相關(guān)性。就是說經(jīng)驗(yàn)主義更相信眼見為實(shí)。 但實(shí)際上世界上不存在所謂客觀的東西。 我們之所以對(duì)世界不理解,是因?yàn)槲覀冇残缘陌?/span>世界分成客觀和主觀,唯物主義與唯心主義,而這種兩分法,實(shí)際上是錯(cuò)的。 任何認(rèn)識(shí)世界離不開主體。 英國數(shù)學(xué)家羅素有一個(gè)著名的火雞悖論。 火雞就是經(jīng)驗(yàn)主義者,每天早上它的主人敲盆來喂食,第二天、第三天也是這樣,那么火雞就得出一個(gè)結(jié)論:以后每天早上主人都會(huì)敲盆來喂食。這個(gè)結(jié)論的有效性一直持續(xù)到圣誕節(jié)的前一晚。 理性主義和經(jīng)驗(yàn)主義爭論的焦點(diǎn)有兩件事:一是知識(shí)的來源到底是推理還是經(jīng)驗(yàn)?二是什么樣的知識(shí)更可靠? 四、默知識(shí)和暗知識(shí) 回過頭我們?cè)倏慈祟悮v史上所謂的知識(shí)是什么。 人類有文字以來,所有的知識(shí),不管是現(xiàn)在的文字還是甲骨文,但凡可以用語言文字或公式表達(dá)的,就是我們認(rèn)為的知識(shí)。 因?yàn)樗梢詡鞑?,可以被別人所理解。 直到70年前,奧匈科學(xué)家邁克爾·波拉尼寫了《個(gè)人知識(shí)》,他認(rèn)為還存在一種非常個(gè)人化的知識(shí),是不可傳播的。后來定位為默會(huì)知識(shí)(tacit knowledge)。 生活中有大量的知識(shí)或技能屬于默會(huì)知識(shí),比如騎自行車、拉提琴、打乒乓球、游泳,都是需要反復(fù)去訓(xùn)練,卻不可表達(dá)。 默知識(shí)有個(gè)特點(diǎn),不可記錄,不可集中。而計(jì)劃經(jīng)濟(jì)的前提就是要把全國的所有信息都放到一臺(tái)計(jì)算機(jī)里,全算出來,再告訴每個(gè)鄉(xiāng)村該生產(chǎn)多少東西。 Iphone沒出來之前,沒有一個(gè)人知道智能手機(jī)應(yīng)該是什么樣。這個(gè)事只能靠企業(yè)家和發(fā)明家的想象力。 按這個(gè)思路想下去,很自然就會(huì)想到,會(huì)不會(huì)存在著一種既不可感受,也不可表達(dá)的知識(shí)?就是暗知識(shí)。 我畫了一張圖,橫軸是否可表達(dá),縱軸是是否可感受。 明知識(shí)是既可感受又可表達(dá),比如浮力定律。還有一類人沒法感受到,比如我們感受不到量子力學(xué)的微觀世界。但它在數(shù)學(xué)上是完美的, 還有一類呢,像量子力學(xué)、廣義相對(duì)論,我們?nèi)藳]法感受到有這個(gè),量子力學(xué)微觀世界,我們也感覺不出來,所以但是它在數(shù)學(xué)上是完美的,一定存在且實(shí)驗(yàn)可證明。這就是不可感知可以被證明的知識(shí)。 很顯然四個(gè)象限就空了一個(gè),就是暗知識(shí)。當(dāng)我完成對(duì)暗知識(shí)的發(fā)現(xiàn)時(shí),感覺又回到了30年前做博士論文。 在斯坦福做博士論文有一個(gè)要求,contribute to human knowledge,就是要對(duì)人類的知識(shí)有貢獻(xiàn)性。 暗知識(shí)就是原來從來沒有任何人提到過的。除非還能發(fā)現(xiàn)一個(gè)獨(dú)立的軸,否則人類所有的知識(shí)全能放在圖里。 這三種知識(shí)之間量的關(guān)系可以用冰山圖表示: 人類有文字以來積累的所有的知識(shí),是冰山在水平面之上的部分;默知識(shí)是海平面以下人們看不見的冰山,而暗知識(shí)就是整片海洋。 人類的基本局限,是接收的信息遠(yuǎn)遠(yuǎn)大于輸出的信息。 ▲ 長按圖片保存可分享至朋友圈 暗知識(shí)作為一個(gè)哲學(xué)概念,與我們的生活息息相關(guān)。 比如機(jī)器學(xué)習(xí)加人臉識(shí)別技術(shù),該不該篩選出那些長著一張壞人臉,概率上犯罪幾率更高的人,比如自動(dòng)駕駛面對(duì)突然跳出來的小孩,不撞自己會(huì)死,撞孩子會(huì)死,該如何選擇。 這都是機(jī)器學(xué)習(xí)或暗知識(shí)擺在我們?nèi)祟惷媲胺浅?yán)峻的問題。 由于暗知識(shí)的不可理解性,會(huì)給人類造成一系列的問題。 美國國防部有一篇白皮書提到: 未來人工智能的不可解釋性,是做公共政策決策上最大的障礙。 當(dāng)機(jī)器告訴你要做什么,也無法跟大眾溝通,這就會(huì)對(duì)多數(shù)決策和制度產(chǎn)生很大的沖突。 五、人工智能產(chǎn)業(yè)生態(tài) 我在公募做投資,每年大概會(huì)看幾百上千家公司。我總結(jié)整個(gè)人工智能的產(chǎn)業(yè)生態(tài),就是金字塔的形狀。最上頭皇冠上的鉆石是算法。 大家說人工智能就是三件事: 算力、算法和數(shù)據(jù)。我覺得算力和數(shù)據(jù)都是胡扯。搭順風(fēng)車數(shù)據(jù)自動(dòng)就變大了,算力就變強(qiáng)了,和人工智能行業(yè)沒關(guān)系。實(shí)際上數(shù)據(jù)的發(fā)展是要算法上有突破。 但算法在今天很難做生意。真正做算法的非常少,主要在大公司和大學(xué)里。 算法里比較重要的核心技術(shù)就是芯片。 簡單來說,所有的芯片公司里最重要的兩家公司,一個(gè)是英偉達(dá),做GPU圖形芯片處理器。 一個(gè)是賽恩斯,做FPGA現(xiàn)場可編程門陣列。這兩家公司占統(tǒng)治地位,現(xiàn)在中國一大堆芯片公司還無法挑戰(zhàn)這兩家公司。 人工智能產(chǎn)業(yè)生態(tài)中另外一個(gè)重要的環(huán)節(jié)是frame編程框架。編程框架大致可以看成操作系統(tǒng)層面的東西,但它不是一個(gè)操作系統(tǒng),而是程序庫。 今天最大的程序庫,是谷歌的TensorFlow。今天所有的人工智能公司,特別是中國的人工智能的公司,全是用的谷歌的開源軟件。它已經(jīng)形成了生態(tài)系統(tǒng)。 在應(yīng)用層面,我要強(qiáng)調(diào)一點(diǎn),以目前發(fā)展的線性預(yù)測,還看不到很多的應(yīng)用。就像汽車剛出來時(shí)大家會(huì)覺得,汽車就是比馬車快的代步工具。 但汽車出現(xiàn)后讓我們有了高速公路,時(shí)間更節(jié)省了,就可以不住在城里了,等等。就造成了一系列的變化。這些變化是在汽車剛剛被發(fā)明時(shí)想不到的。 我投資過一家做金融醫(yī)療的公司。對(duì)慢性病患病的原因可能有很多,包括飲食、基因、臟腑器官等等??赡艿脑蛉苛谐龃蟾藕脦装賯€(gè)。 而且直接的原因背后還有間接的原因,第二層、第三層、第四層,一個(gè)病就可以畫成一個(gè)非常復(fù)雜的網(wǎng)絡(luò)。 但人類醫(yī)生看病可能只有五分鐘時(shí)間,因?yàn)橐惶煲次濉⒘畟€(gè)病人,根本沒時(shí)間。所以只能抓住最最主要的兩三個(gè)因素,基本上是根據(jù)經(jīng)驗(yàn)做判斷。 但機(jī)器不一樣。機(jī)器學(xué)習(xí)是把所有歷史數(shù)據(jù)全部輸進(jìn)去,這樣可以建立起非常復(fù)雜的系統(tǒng)。 機(jī)器看500萬個(gè)這樣的系統(tǒng),就相當(dāng)于看了500萬個(gè)病人。全世界沒有一個(gè)醫(yī)生一生中看那么多病人。這樣AI就可以成為最有經(jīng)驗(yàn)的醫(yī)生。這家公司通過了美國的醫(yī)生資格考試。 六、產(chǎn)業(yè)適合或不適合 發(fā)展人工智能的判斷依據(jù) 神經(jīng)網(wǎng)絡(luò)的本質(zhì)是讓機(jī)器在海量的變量里頭,發(fā)現(xiàn)人類發(fā)現(xiàn)不了的復(fù)雜的相關(guān)性。
|
|