如何創(chuàng)造真正的人工智能

小天使_ag 2013-05-03

展開全文

如何創(chuàng)造真正的人工智能

jin科技前沿：[ 微信公眾號：funjinn QQ號：12783747 ]

谷歌工程主管：如何創(chuàng)造真正的人工智能

據國外媒體報道，谷歌工程主管雷·庫茲韋爾（Ray Kurzweil）日前接受了媒體采訪，介紹了他加盟谷歌的目的。作為一位著名企業(yè)家、發(fā)明家和未來學家，他加盟谷歌曾引起轟動。但庫茲韋爾介紹說，他畢生的目標就是創(chuàng)造真正的人工智能，而谷歌擁有龐大的數據和計算資源，這是其他公司不能提供的優(yōu)勢，也是他開發(fā)人工智能的必備因素。騰訊科技匯編。

jin摘錄如下：

庫茲韋爾現(xiàn)年65歲，他有過很多發(fā)明成果，包括音樂合成器、語音識別系統(tǒng)等。早在14歲的時候，他就想要創(chuàng)造一種真正的人工智能，甚至預測機器將在2029年達到人類的智能?，F(xiàn)在，作為谷歌的工程主管，他尤其專注于使計算機真正理解，甚至發(fā)出自然語言，并最終希望創(chuàng)造一種“電子好友”（cybernetic friend），能夠在你做事情之前就知道你想做什么。

問：在你的著作《如何培養(yǎng)思維》（How to Create a Mind）當中，你提出了大腦如何工作的理論。能否簡要解釋一下？

答：世界是多層次的，只有哺乳動物擁有大腦皮層，而大腦皮層的發(fā)展有助于更好地理解世界結構，因此你可以更好地根據自己的需求進行調整，并在多層次的世界里解決問題。我們應當分層次進行思考。我們的第一個發(fā)明就是語言，而語言也是分層次的。

深入學習，也就是我所說的分層次學習，背后的理論在于，你應當有一種模式來反映想要學習的自然現(xiàn)象的不是層級。如果沒有這種模式，你的學習能力就會變弱，也會被表面現(xiàn)象所迷惑。

問：為何理解自然語言是終極挑戰(zhàn)？

答：阿蘭·圖靈（Alan Turing）進行的圖靈實驗完全依據書面語言。根本上講，這是一個即時信息游戲。要真正掌握自然語言，甚至是掌握書面形式的語言，達到完全令人類信服的水平，這需要全面的人工智能。你需要的不僅僅是簡單的語言處理技巧，有很多聊天機器人也能做這樣的事情，這會令一些人感到誤解。事實上，它們根本無法有效地通過圖靈實驗。

因此，自然語言是人工智能的一個非常深奧的領域，在其他地方我無法像在谷歌一樣完成這樣的項目?，F(xiàn)在，我已經在這里工作了幾個月，我能夠看到拉里·佩奇的團隊具備的智慧。

問：為什么這么說？谷歌能夠為你實現(xiàn)目標提供什么幫助？

答：以谷歌的知識圖譜（Knowledge Graph）為例，這是一個擁有7億個主題、地點、人和其他概念的目錄。如果想要理解自然語言，你就必須理解世界上的這些概念和事物，無論是抽象事物還是具體事物。現(xiàn)在知識圖譜擁有7億個入口，數十億個鏈接，并且仍在快速增加。這是我無法創(chuàng)造的內容。顯然，我們要充分利用知識圖譜，因為如果要模仿語言在說什么，你就必須鏈接到這些概念的知識基礎，它們之間已經建立了一些聯(lián)系。還有其他一些技術，例如句法分析，這是谷歌以外的地方看不到的。

問：你的著作里有個章節(jié)介紹了在芯片和軟件里培養(yǎng)真正思維的步驟。這是否是你在谷歌工作的目的，至少是最終目的？

答：我曾披露過總體的方向，但是我也有一些私人的觀點，顯然不會在書里分享，尤其是如何建立層級。我并沒有在書里談及這些內容。關鍵在于，這些層級并非生而有之，與生俱來的是毫無關聯(lián)的模塊，相互之間沒有形成任何模式。然后我們開始學習，甚至在我們出生之前就開始學習，因為我們在26周的時候就睜開眼睛，并開始學習聲音。

重要的是，大腦皮層創(chuàng)造了這種層級，也就是這些模塊如何與更高級的模塊聯(lián)系起來。這需要很多年，甚至幾十年才能達到一定的水平。因此，即便大腦皮層非常出色，如果沒有學習過程，這也無濟于事。因此，打造人工智能實際上就是創(chuàng)造一個學習過程。

問：你打算怎么做？

答：我知道如何利用模擬大腦形成的數據層級。這正是我在這里需要做的事情。拉里·佩奇對這本書感到非常興奮，并且非常重視人工智能。因此我有很大的獨立性，我并沒有受到什么規(guī)格限制，也不必受制于接下來幾年需要做什么。

盡管沃森曾經擊敗過兩位最出色的人類選手，但它獲勝是因為規(guī)模大，因為它可以處理2億頁的內容，而你我卻無法閱讀100萬頁的內容。因此，它的理念就是要擁有足夠的語義，即便我們無法發(fā)掘全部的語義，或者像人類世界那樣的規(guī)模，但我們可以通過每個網頁，每部書頁，一步一步地在搜索領域做得更好。這就是搜索和知識導航的總體方向。

問：你的出發(fā)點在哪里？是否需要克服什么挑戰(zhàn)才能走上正軌？

答：關于如何模仿語義，我腦海里的想法就是眼前面臨的挑戰(zhàn)。在語音識別方面，我可以非常簡單地描述出語音信號輸出的意義：這其實是其他人所說內容的轉述。然后，我可以努力創(chuàng)建一個擁有100萬種發(fā)音和正確翻譯的數據庫。這是一個巨大的項目，但卻是切實可行的。隨后你可以進行一些學習算法。我們使用的是分層次學習方法。然后，你可以通過自己的經驗開始學習。

這是第一個步驟，也就是正確地翻譯語言發(fā)音，這與自然語言理解一樣困難。你如何反映語言的正確意思？即便不考慮人們語言中的含糊之義，你如何描述它的意思？我腦海中有一個以圖形表達語義的想法?；蛟S它無法抓住每一個細節(jié)，但目前的計算機程序無法抓住任何一個語義細節(jié)。

然后，我想要建立一個語音識別數據庫。你可以便捷地獲得很多文本范例，只需前往維基百科就可以獲得數百萬個頁面。然后可以建立一個正確翻譯的數據庫，用來表達語義。隨后，我們可以研發(fā)一種深入學習算法，用于進行語義翻譯。這樣在遇到一個新句子的時候，或許是用戶在提問中使用的新句子，也或者是每分鐘都會出現(xiàn)的新網頁里的新句子，它能夠正確地進行翻譯。

問：你和你的團隊會不會與谷歌的其他人工智能相關團隊進行合作？

答：我已經成立了一支團隊，有些是內部轉崗，有些則來自外部。我會充分利用這里的其他資源。例如，我們需要充實知識圖譜，使其具有更廣闊的關系網。目前的知識圖譜還不足以涵蓋語言所表達的所有關系。因此，我們在自然語言理解方面首先要做的就是讓知識圖譜團隊擴充知識圖譜，并加入更多的關系。

問：你的最終目標是不是打造一種能夠通過圖靈實驗的人工智能，或者能夠利用這些技術提升人類大腦？或者你會不會把這兩件事情分開來完成？

答：如果你談的是我的職業(yè)，那么我首先是一個發(fā)明家。我進入未來學術領域，也是為了服務于自己的發(fā)明事業(yè)。時間很重要，著名發(fā)明家都能夠很好地把握時機。拉里·佩奇和謝爾蓋·布林在整理互聯(lián)網鏈接、打造更好的搜索引擎方面形成了出色的理念。如果他們早幾年或者晚幾年，你或許就不會知道他們的名字。這就像雙向飛碟射擊一樣。回想三到四年前，大多數人還沒有使用社交網絡、維基和博客。回想十多年前，大多數人還沒有使用過搜索引擎。

我的個人動機并不是打造一臺能夠通過圖靈實驗的計算機，而是做出一種短期的貢獻。自然語言理解是一個沒有終點的目標，搜索也是如此。我認為這個項目沒有結束的那一天。

問：深入學習和神經網絡會如何改變計算機的本質？

答：馮諾伊曼計算機（也就是如今所有傳統(tǒng)計算機的基礎）的結構與大腦結構有很大區(qū)別。在大腦里，100萬億個神經元連接都在同時進行計算。因此這是真正的大規(guī)模平行處理。但是這些計算速度非常緩慢，例如每秒只能計算100次。而且這些計算本身并不重要，它只是形成了一個概率整體。計算機并不是這樣。

超級計算機的速度已經超過了模仿人腦所需的運算能力，不僅在分子層面模仿，而且在功能方面模仿。這是一個重要的區(qū)別。過去曾有亨利·馬克萊姆（Henry Markram）發(fā)起、已獲10億歐元資助的“藍腦計劃”，現(xiàn)在美國又有了“腦活動地圖”（Brain Activity Map），這是為了在分子層面復制大腦。

問：你認為這并非可行的道路？

答：這是一個偉大的項目，但并非創(chuàng)造人工智能的正確道路，而是檢驗我們對人腦工作理念的方法。這是了解大腦、了解神經如何工作、了解離子渠道如何運行的有效方法，也是創(chuàng)造大型大腦模仿器并看它是否正確運行的好方法。這是研究大腦的方法，然后我們可以進行借鑒，利用這種生物算法來創(chuàng)造人工智能。

問：還有哪些因素會決定我們何時看到真正的人工智能？

答：需要考慮“加速回報定律”。根據信息技術的進步，我們總是用今天的技術去創(chuàng)造下一個技術。軟件領域同樣如此。只要有一個系統(tǒng)運行，我們就可以改進它，而且是成倍地改進，而非漸進式的改進。同樣的技術可以使我們看到大腦內部，大腦掃描的分辨率不斷提升，我們通過神經學獲得的數據模塊也越來越多。然后，我們可以利用這些信息研究如何利用大腦的生物算法改進人工智能。

jin科技前沿：[ 微信公眾號：funjinn QQ號：12783747 ]