1月13日,2017極客公園創(chuàng)新大會(huì)“GIF17”在北京召開(kāi)。大會(huì)共將進(jìn)行三天,邀請(qǐng)了包括雷軍、羅永浩、馮鑫、王小川,以及人工智能專(zhuān)家李飛飛,美國(guó)登月宇航員Buzz Aldrin等眾多大佬,一起暢談互聯(lián)網(wǎng)下半場(chǎng)、人工智能風(fēng)口上,如何實(shí)現(xiàn)產(chǎn)品力、探索力、影響力的變革。 會(huì)上,搜狗創(chuàng)始人王小川,發(fā)表了主題為“人工智能照進(jìn)現(xiàn)實(shí)”的演講,演講內(nèi)容要點(diǎn)及原文如下,整理者李基祥。 演講要點(diǎn): ①人工智能的技術(shù)進(jìn)步是很困難的,需要時(shí)間的,而比更難的是把技術(shù)變成產(chǎn)品,因此我們要從價(jià)值、前沿技術(shù)、用戶規(guī)模三個(gè)維度來(lái)看人工智能。 ②搜狗發(fā)布了新的功能——搜狗海外搜索,是希望中國(guó)的網(wǎng)絡(luò)用戶,不但能搜索到全球內(nèi)容中10%的中文部分,還能了解到剩下的90%。 ③王小川認(rèn)為,不存在機(jī)器取代人的問(wèn)題,人工智能的進(jìn)步意味著人的自由被釋放了,有能力去做更多創(chuàng)造性的事情。 演講原文(有刪減): 極客公園的朋友們,大家好。 在一年的時(shí)間里面,我們學(xué)到了太多的詞匯,包括AlphaGo、語(yǔ)音識(shí)別等等,里面有很多學(xué)術(shù)的概念。還有我們?cè)?jīng)叫做對(duì)偶網(wǎng)絡(luò)、對(duì)抗生存網(wǎng)絡(luò)等各種各樣的詞匯。 所以我在想,用什么樣的脈絡(luò)去梳理,從研究到最后每個(gè)消費(fèi)者,包括人類(lèi),能夠面對(duì)人工智能對(duì)我們的沖擊。 人工智能要從三個(gè)維度去看 這里我們提個(gè)簡(jiǎn)單的模型,這個(gè)模型不僅是對(duì)于人工智能或者計(jì)算機(jī)適用,而且是我們?cè)趺窗鸭夹g(shù)變成產(chǎn)品,再變成商業(yè)價(jià)值,或者全人類(lèi)共享的價(jià)值,因此要從價(jià)值、前沿技術(shù)、用戶規(guī)模三個(gè)維度來(lái)看。 我們經(jīng)常收到簡(jiǎn)歷,現(xiàn)在有個(gè)詞特別高大上“全棧工程師”。就是不僅能寫(xiě)前臺(tái),還能寫(xiě)后臺(tái),我自己對(duì)自己的理解,是需要做一個(gè)“全棧的CEO”。要從研究上理解、去工作,能夠理解背后的技術(shù),怎么做產(chǎn)品,以及把它變成商業(yè)價(jià)值,或者是全人類(lèi)的共同價(jià)值。 在這里面,如果你一開(kāi)始沒(méi)有技術(shù)含量,我們知道是很難變成產(chǎn)品的,但是有技術(shù)不一定是有產(chǎn)品,不一定有用戶的規(guī)模。有技術(shù)、有用戶規(guī)模,也不一定背后就能帶來(lái)很大的商業(yè)價(jià)值,或者是對(duì)世界的貢獻(xiàn)。 在去年3月份,AlphaGo是一個(gè)黑科技,今天我們看到在技術(shù)層面它已經(jīng)實(shí)現(xiàn)了,并且已經(jīng)面世,但是它還沒(méi)有用戶規(guī)模和商業(yè)價(jià)值。AlphaGo包括圖像描述,剛才李飛飛教授講的圖像描述,其實(shí)還沒(méi)法形成用戶規(guī)模。 互聯(lián)網(wǎng)從業(yè)人員作為好奇者,能看到大量的很令人驚艷的科技,但是這些技術(shù)其實(shí)沒(méi)讓你用到,還沒(méi)有走到第二步去。所以,今天在圖像描述、圖像的合成里,不知道大家注意到?jīng)]有,像張鵬和李飛飛,都有一個(gè)風(fēng)格遷移的技術(shù),我把它稱(chēng)為圖像合成的子方向。讓大家感到很酷,但是這種產(chǎn)品,其實(shí)還沒(méi)法形成用戶的規(guī)模。 再往下,有些技術(shù)不僅是黑科技,還開(kāi)始變成用戶規(guī)模,像語(yǔ)音的識(shí)別、像人臉識(shí)別。但這兩個(gè)技術(shù)在我心中,它不像機(jī)器可以做判斷、做選擇,最后能形成商業(yè)的價(jià)值,或者給用戶帶來(lái)實(shí)際的變化,影響還是不夠大的。 能夠看到什么東西影響大呢?我們作為一個(gè)好奇的群體,我們想,能夠在無(wú)人駕駛領(lǐng)域,這是大家覺(jué)得這既覺(jué)得很黑科技,而且未來(lái)有很大的用戶規(guī)模,并且有很大的商業(yè)價(jià)值,或者是對(duì)世界的改變。但對(duì)不起,還沒(méi)有面世。 從這個(gè)維度來(lái)講,我們會(huì)發(fā)現(xiàn),今天人工智能變成所有人去追捧的一個(gè)熱潮。但是,并沒(méi)有找到一個(gè)既已經(jīng)面世,但又同時(shí)有巨大用戶規(guī)模,還有巨大改變世界能力的這樣的技術(shù)。 在這個(gè)過(guò)程很難:我們能夠做出技術(shù),并且讓這個(gè)技術(shù)保持領(lǐng)先,就是一個(gè)困難的事情。去年我分享過(guò),有些技術(shù)剛剛回國(guó)的時(shí)候是領(lǐng)先的,我們開(kāi)始做公司、把它變成產(chǎn)品,還沒(méi)等到變成產(chǎn)品或者商業(yè)化,這個(gè)技術(shù)就開(kāi)始落后了,發(fā)展特別快。因此,保持技術(shù)領(lǐng)先,這是一個(gè)難題。更難的是把一個(gè)技術(shù)變成產(chǎn)品,讓很多的用戶受益。更更難的是,這個(gè)技術(shù)不僅有它的用戶規(guī)模,還能夠去改變世界,有很大的商業(yè)上的意義和對(duì)世界的沖擊。 搜狗在人工智能上做過(guò)的嘗試 之前我的PPT這頁(yè)標(biāo)題叫做“AI正在過(guò)河”,但是AI是很泛的概念,在中間的子集就是以深度學(xué)習(xí)為代表的,能夠更好的從答案里面,尋找規(guī)律的這樣一種技術(shù),所以現(xiàn)在的標(biāo)題家叫做“深度學(xué)習(xí)正在過(guò)河”。 搜狗,我們的想法,第一件事情,是我們有這種技術(shù),而且我們能夠把這種技術(shù)用到搜狗的產(chǎn)品里面去。很多創(chuàng)業(yè)公司試圖去構(gòu)造新產(chǎn)品,而我們一個(gè)大的邏輯,是已經(jīng)讓千家萬(wàn)戶用到產(chǎn)品,然后去做升級(jí)。 因此,其實(shí)深度學(xué)習(xí)已經(jīng)通過(guò)搜狗武裝到了牙齒,我們的主產(chǎn)品里面有大量的使用。比如說(shuō)輸入法,里面會(huì)用到語(yǔ)音識(shí)別和圖像識(shí)別。語(yǔ)音識(shí)別,我們現(xiàn)在一天用戶規(guī)模上已經(jīng)做到了2億次的識(shí)別量,。同時(shí),一天識(shí)別生產(chǎn)的語(yǔ)音數(shù)據(jù)量,大概能到18萬(wàn)小時(shí),這是巨大的語(yǔ)料規(guī)模。我們大概用了400臺(tái)GPU服務(wù)器,來(lái)支撐這個(gè)規(guī)模。另外打開(kāi)輸入法,你看到我們里面有OCR的能力,你可以用手寫(xiě),或者是拍一張照片里面的文字,也能做到。所以,其實(shí)我們?cè)谧鲆粋€(gè)漸進(jìn)的事情。 在搜索里面也是,我昨天在硅谷,還跟Google他們的核心在溝通,Google還講到,用深度學(xué)習(xí),能夠?qū)τ谟脩糨斎氲拿钊プ龇纸?。以前是靠我們?nèi)嗽诶锩娼y(tǒng)計(jì)去做規(guī)則,規(guī)則越來(lái)越多,效果并不一定好。今天靠深度學(xué)習(xí)去做,對(duì)搜索引擎的描述,它的準(zhǔn)確率提升了30%,跟我們的值是一樣的。已經(jīng)成為,搜索引擎排序里面第三重要的因素。 這是深度學(xué)習(xí),我們?cè)谒阉鬟@個(gè)類(lèi)型的公司里面,能快速把它推向使用的案例。但是,這樣一個(gè)技術(shù)還沒(méi)有到顛覆的程度,我覺(jué)得符合我們剛才講的面世了、有前沿的技術(shù)、有大的用戶規(guī)模,但是并不構(gòu)成對(duì)世界有更大的沖擊。 新功能——搜狗海外搜索 回到搜狗的邏輯,我們是讓用戶表達(dá)和獲取信息更簡(jiǎn)單。通過(guò)輸入法,提高了很多中國(guó)人打字中的效率,搜索讓獲得很多的信息。而且剛才講,通過(guò)深度學(xué)習(xí),使得這的產(chǎn)品更加聰明和豐滿。 那還有什么事情再往前去解決?借助深度學(xué)習(xí)今天我們前沿的成果?在這里面,我給大家分享《圣經(jīng)》里面的小故事,這有足夠大的意義來(lái)闡述,就是關(guān)于通天塔的故事。 大家知道,人類(lèi)很想通過(guò)自己的努力,去構(gòu)造一座通天塔,能夠直接跟上帝對(duì)話。上帝覺(jué)得,藐視了他的權(quán)威。因此,他就讓不同的人、不同的民族,去說(shuō)不同的語(yǔ)言。由于大家說(shuō)不同語(yǔ)言之后,溝通變成了一個(gè)障礙。所以,人就沒(méi)有能力去修建通天塔。 這是我經(jīng)常引用的,由于這種信息不對(duì)稱(chēng)、不對(duì)等,使得我們難以合力去在一件最偉大的事情。但這里面,不僅是網(wǎng)絡(luò)連接,而且還涉及到一件事情,就是不同民族語(yǔ)言不一樣。 去年11月份,Google有篇很重要的論文,把機(jī)器翻譯推到了一個(gè)新的高度。所以在這里面我們?nèi)诚耄绻覀冊(cè)诒磉_(dá)、獲取的時(shí)候,能夠讓不同民族的人,包括中文、英文,能夠自由的交流,獲得獲得他們完整的信息,這個(gè)世界會(huì)因此而變。 所以在這樣的使命里面,我會(huì)認(rèn)為,如果能夠跨語(yǔ)言進(jìn)行溝通,這樣一個(gè)技術(shù)的進(jìn)步,猶如人類(lèi)發(fā)明了電一樣是很重要的事情,電使得我們的生產(chǎn)力得到了巨大的解放。但如果能做到跨語(yǔ)言的溝通,地球的文明會(huì)重新改寫(xiě),戰(zhàn)爭(zhēng)會(huì)變得更少,不同民族之間的交流會(huì),帶來(lái)新的一種新文明的產(chǎn)生。所以,這里面我們做了很多的工作。 一方面,在Google技術(shù)的指引下,我們完整用了這樣一些技術(shù),是基于類(lèi)似于深度神經(jīng)元網(wǎng)絡(luò)的翻譯模型,已經(jīng)被我們掌握得非常好。 而且我們很有幸,跟清華有更多的合作,在這里面有一些技術(shù)上的經(jīng)驗(yàn),很快會(huì)融入我們的模型里面。所以,不僅是深度學(xué)習(xí)的網(wǎng)絡(luò),還有其它技術(shù)的合力。 另外我認(rèn)為,我們比Google更有動(dòng)力和決心,去做好翻譯這件事情。Google代表技術(shù)的高度,但是它在我心中有種玩票的心態(tài),因?yàn)樗鎸?duì)的不僅是中文、英文這樣的事情,作為中國(guó)人我們是非常有意愿要跟英語(yǔ)國(guó)家、英語(yǔ)的世界對(duì)話,Google同時(shí)一做就是上百種語(yǔ)言,或者8種語(yǔ)言之間怎么去互譯,我懂得2種語(yǔ)言,只能把第3種語(yǔ)言加進(jìn)去,所以對(duì)它是一種秀肌肉的事情。 但是,對(duì)于世界上最大的一個(gè)語(yǔ)言-中文,我們是有非常大的動(dòng)力,把它真正變成一個(gè)現(xiàn)實(shí),所以說(shuō)這樣的一種動(dòng)力的驅(qū)動(dòng)下,我們實(shí)際做到產(chǎn)品的識(shí)別準(zhǔn)確度,是比Google更高的,因?yàn)槲覀儽人懈鼜?qiáng)的意愿去做好中文到英文這樣的一個(gè)對(duì)譯,后面有這樣一些對(duì)比的評(píng)測(cè)數(shù)據(jù)。 基于這樣的事情,我們已經(jīng)在產(chǎn)品上開(kāi)始去發(fā)力,有了一些黑科技。我在去年烏鎮(zhèn)的世界互聯(lián)網(wǎng)大會(huì)上,就首發(fā)了搜狗機(jī)器同傳。然后在香港科技大學(xué),我們更是把機(jī)器同傳帶進(jìn)了實(shí)用,就是中文到英文的過(guò)程。 在烏鎮(zhèn)大會(huì)我們叫做首秀,因?yàn)闉蹑?zhèn)世界互聯(lián)網(wǎng)大會(huì),說(shuō)是一個(gè)世界性的互聯(lián)網(wǎng)大會(huì),但是在座的觀眾中很多都是中國(guó)人,即便是老外,他們其實(shí)也戴了同傳的耳機(jī),所以這時(shí)發(fā)布的是一個(gè)概念性的產(chǎn)品。 我們?cè)谙愀劭萍即髮W(xué),發(fā)布這個(gè)產(chǎn)品的時(shí)候,下面大概有30%,真正是國(guó)外的學(xué)生,而且也沒(méi)有提供其他同傳的設(shè)備,直接依靠機(jī)器同傳來(lái)聽(tīng),事后我就問(wèn)他們聽(tīng)懂了嗎?他們說(shuō),確實(shí)用中文演講的內(nèi)容,他們也都能夠聽(tīng)懂。這個(gè)我沒(méi)有做視頻的宣傳,但是在網(wǎng)上有一些傳播。 事實(shí)上,這樣的技術(shù),并不符合我剛才的理念,雖然是很好的技術(shù),但并不是給所有人都去使用的。我們?cè)谌ツ昴甑?,把這個(gè)技術(shù)放到了搜狗輸入法里面去,當(dāng)你在里面去敲中文的時(shí)候,只要你點(diǎn)個(gè)鍵,這句話就能把它翻譯成英文,再點(diǎn)個(gè)鍵,你就能把它發(fā)送出去。所以,使得你要跟國(guó)外的朋友聊天,或者寫(xiě)郵件的時(shí)候,變得更加容易,這是我們輸入法增加的一個(gè)功能。可以看到,點(diǎn)擊個(gè)花鍵,點(diǎn)擊翻譯鍵,就能得到翻譯的結(jié)果。 今天,我重頭想給大家?guī)?lái)的是,之前一直保密,也是因?yàn)檫@次活動(dòng),我們準(zhǔn)備的一個(gè)新產(chǎn)品,在這次活動(dòng)上發(fā)布。我們稱(chēng)之為,搜狗的海外搜索。 聽(tīng)到這個(gè)詞,我們就知道它一定是跟跨語(yǔ)言的翻譯工作相關(guān)。它是什么呢?我們?cè)谝郧八阉鞯臅r(shí)候,中文信息可能只占世界信息的10%,不會(huì)更多了。大量?jī)?yōu)質(zhì)的內(nèi)容是在海外,但是很不幸,一個(gè)是Google目前在大陸地區(qū)無(wú)法使用。第二,即便我們會(huì)用Google,作為一個(gè)中國(guó)人,我們確實(shí)要承認(rèn)我們英文水平不夠高,用中文搜索的時(shí)候沒(méi)有足夠的信息,要用英文搜索,去獲得英文的答案,是很困難的。 因此,今天我們要發(fā)布的海外搜索產(chǎn)品,是給中國(guó)人用的,幫助英文不夠流利,或者效果不夠高的朋友。我們實(shí)現(xiàn)了當(dāng)你用中文詞輸入的時(shí)候,能自動(dòng)翻譯成英文,去檢索英文世界的內(nèi)容,同時(shí)把它翻譯成中文并閱讀。 所以,這個(gè)產(chǎn)品的3個(gè)頁(yè)可以看到,左邊是搜索的海外英文內(nèi)容,當(dāng)你點(diǎn)個(gè)鍵之后,就能以中文的方式閱讀它,而且提供了雙語(yǔ)的翻譯。 能干嘛用呢?就像我們之前看到,有大量我們對(duì)海外感興趣的事情,包括專(zhuān)業(yè)的詞匯,像細(xì)胞免疫療法,目前網(wǎng)上不可避免有很多虛假的信息,這樣搜索能看到海外大家是怎么做這件事的。 包括,我們想知道人工智能海外的發(fā)展,我們可以看人工智能的初創(chuàng)公司,這里搜索到的就是在國(guó)外最前沿的一些人工智能公司是哪些,或者我們想知道我們追的明星lady gaga,大家對(duì)她是怎么看的。我們甚至能看到,像李飛飛,我們?cè)谥袊?guó)世界是這樣看到她,那么在西方世界又是怎么認(rèn)知她的。我們通過(guò)搜狗海外搜索,不僅能搜到10%的世界,還能搜索到90%的世界,這是對(duì)我們巨大的促進(jìn)。 所以,我們今天首發(fā)了這個(gè)產(chǎn)品,這是搜狗第一次在極客公園上進(jìn)行這樣的首發(fā),而且也是全球第一次把深度神經(jīng)元網(wǎng)絡(luò)的翻譯系統(tǒng),變成一個(gè)完整的跟搜索相關(guān)的產(chǎn)品,能夠惠及每個(gè)中國(guó)人。如果單獨(dú)給你一個(gè)翻譯產(chǎn)品,大家用起來(lái)很費(fèi)力,但我們把它放在搜索引擎里面去,就能夠使得我們有機(jī)會(huì)搜索全世界的內(nèi)容。 在這背后,我們還有很多工作去做,這個(gè)翻譯工作非常非常細(xì)膩,有些前沿的詞匯并沒(méi)有做到中英文的對(duì)應(yīng)。像我昨天從美國(guó)回來(lái),查“美聯(lián)航空在線值機(jī)”,但翻譯過(guò)去再翻譯過(guò)來(lái),就變成了聯(lián)合航空在線值機(jī),這里面有很多很多工作需要做透。做搜索引擎,使得我們有機(jī)會(huì)很努力的逐步去迭代。同時(shí),我們需要把這樣的搜索技術(shù)跟網(wǎng)頁(yè)搜索做到合體,現(xiàn)在是單獨(dú)海外搜索,之后還要跟我們的網(wǎng)頁(yè)搜索做整合。同時(shí),再投入更大的機(jī)器資源,使得大家能全面的瀏覽,不僅搜索上能做翻譯,使得海外的內(nèi)容能做到完整的中文閱讀,翻譯之后能讓大家用中文看到整個(gè)世界。 人和機(jī)器之間,到底是什么樣的關(guān)系? 我們做了這樣的工作之后,翻譯技術(shù)如果得以解決,我們?cè)谙?,到底?duì)未來(lái)會(huì)造成怎樣的變化?也是今天大會(huì)的主題。是去取代人類(lèi),還是幫助人類(lèi)?在網(wǎng)上,已經(jīng)開(kāi)始有了這樣的討論。是取代人類(lèi)嗎?我們的翻譯系統(tǒng),使得把專(zhuān)業(yè)的翻譯扔掉了,那這個(gè)人群就沒(méi)有了工作。但是,對(duì)更多人有了幫助。所以,我們反復(fù)的題目是,有了機(jī)器學(xué)習(xí)、深度學(xué)習(xí)之后,究竟機(jī)器和人是什么關(guān)系?這是我兩個(gè)思考的結(jié)論: 1、我在前年極客公園大會(huì)上提到“智慧的體外進(jìn)化”,有了機(jī)器之后,我們要心甘情愿的跟機(jī)器合體。我們跟機(jī)器是融合的,不要孤立地看人,離開(kāi)機(jī)器我們會(huì)變得更加脆弱,但如果心甘情愿的把機(jī)器當(dāng)成我生命中的一部分,我們會(huì)變得更加強(qiáng)。 就像一只猴子,問(wèn)它你希望變成人嗎?猴子可能很茫然。同樣問(wèn)一個(gè)人,你希望變成一個(gè)超人嗎?我們可能很茫然。這種成為超人的代價(jià),是跟機(jī)器合體。 2、如果我的工作被取代了會(huì)怎樣?這幾天我在讀的哲學(xué)書(shū)里面,又讀到一個(gè)尼采的思考。他說(shuō),這個(gè)地球開(kāi)始變成一個(gè)大的分工,每個(gè)人就像螺絲釘一樣,做了一個(gè)局部的事情。比如說(shuō),翻譯、司機(jī),我們好象找到了一份工作,但其實(shí)被限制了我們的自由,我們精確在社會(huì)分工中完成一個(gè)原有的使命。 但是,當(dāng)機(jī)器開(kāi)始取代這個(gè)精確的分工之后,其實(shí)是把我們的束縛解放了,我們可以去做一些更有創(chuàng)造性的事情。沒(méi)有這種失去,就沒(méi)有新的獲得。 所以從我內(nèi)心里面有一句話,我是愿意做帶路黨,把機(jī)器的智能文明,帶到人的世界里去。另一方面,我們其實(shí)對(duì)于每個(gè)被分工細(xì)化的人有所解放,強(qiáng)迫我們獲得一種新的自由,去尋找更多創(chuàng)造性的意義。 這是我想產(chǎn)出的AI和我們之間的關(guān)系。 我今天給大家的演講就到這里,謝謝。 本文系投稿稿件,作者:王小川;轉(zhuǎn)載請(qǐng)注明作者姓名和“來(lái)源:億歐”;文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表億歐對(duì)觀點(diǎn)贊同或支持。 |
|
來(lái)自: 易良義 > 《網(wǎng)摘》