文章來源:韓依民 1月14日,在2017極客公園GIF大會(huì)上,搜狗CEO王小川發(fā)表“人工智能和你我會(huì)是什么關(guān)系”的主題演講。 在演講中,王小川對人工智能學(xué)術(shù)與應(yīng)用之間的關(guān)系進(jìn)行了闡述。王小川認(rèn)為,從技術(shù)到產(chǎn)品再到商業(yè)價(jià)值要從彼此實(shí)現(xiàn)的角度來看。 王小川認(rèn)為,有技術(shù)不一定有產(chǎn)品,不一定代表用戶的規(guī)模,有技術(shù)有用戶規(guī)模,也不一定背后可以帶來商業(yè)價(jià)值。 基于這樣的理解,王小川介紹,搜狗人工智能的大邏輯是讓人工智能技術(shù)通過一些產(chǎn)品來實(shí)現(xiàn),使得已經(jīng)讓千家萬戶用到的產(chǎn)品做升級,“其實(shí)深度學(xué)習(xí)已經(jīng)通過搜狗武裝到了牙齒”。 在演講中,王小川還首次對外發(fā)布了搜狗的最新產(chǎn)品海外搜索,針對中國人,幫助英文不夠流利,或者還是效率不夠高的用戶,實(shí)現(xiàn)用中文詞輸入可以翻譯成英文,檢索英文世界的內(nèi)容,同時(shí)把它翻譯成中文的結(jié)果。 “我們之前看到大量對海外感興趣的事情,細(xì)胞免疫療法,在中國得到很多虛假的信息,可以看到海外怎么說這個(gè)事?!?/p> 最后,王小川還闡釋了他對人工智能與人之間關(guān)系的思考,王小川對人工智能的意義表示樂觀,他認(rèn)為人工智能不是取代人,而是幫助人類獲得新的自由。 “我愿意把機(jī)器的智能文明帶到人的世界里去,另一方面我們對于已經(jīng)被分工細(xì)化的人有新的解放,強(qiáng)迫我們獲得一種新的自由,去尋找更多創(chuàng)造性的意義?!?/p> 以下為王小川演講實(shí)錄: 極客公園的朋友們大家好!今天給大家分享人工智能,這個(gè)話題已經(jīng)談了一年多。李飛飛教授給大家做了一個(gè)89頁的PPT,講了一下研究界做了多少工作。這種情況下我做了一個(gè)子標(biāo)題,人工智能照進(jìn)現(xiàn)實(shí),我們把這些科研成果變成實(shí)實(shí)在在能夠用到的產(chǎn)品。 一年的時(shí)間里面我們學(xué)了太多的詞匯,包括Alpha Go、語音識別,里面有很多的學(xué)術(shù)概念。更多像對抗生成網(wǎng)絡(luò),有各種各樣的詞匯。 我提一個(gè)簡單的模型,這個(gè)模型不僅對于人工智能或者對技術(shù)使用,我們從技術(shù)怎么把它變成產(chǎn)品,再怎么變成一個(gè)商業(yè)價(jià)值或者全人類共享的價(jià)值,要從三個(gè)維度看。 我自己講,現(xiàn)在有一個(gè)詞高大上,叫全棧工程師,我自己對自己的理解是需要做全棧的CEO。這里面我們看到,如果你一開始沒有一個(gè)你的技術(shù)含量,我們知道是很難變成產(chǎn)品的,有技術(shù)不一定有產(chǎn)品,不一定代表用戶的規(guī)模,有技術(shù)有用戶規(guī)模,也不一定背后可以帶來商業(yè)價(jià)值。 在這里面,我們簡單做了一個(gè)圖,我試圖把我們現(xiàn)在有的技術(shù)產(chǎn)品放進(jìn)去。在去年3月份,Alpha Go是一個(gè)黑科技,我們今天看在這些技術(shù)里面,我把所有跟人工智能相關(guān)的前沿都表達(dá)成是我們一種新技術(shù)。列的這些都有技術(shù),但是前三項(xiàng)里面Alpha Go還有圖像描述,剛才李飛飛教授講的圖像描述,還沒法形成用戶規(guī)模。我們說云端大家作為好奇者,你可以看到很驚艷的科技,其實(shí)沒讓你用到,還沒有走到第二步。 今天在圖像描述、圖像合成里,包括大家注意到?jīng)]有,張鵬和李飛飛都有一個(gè)風(fēng)格遷移的技術(shù)。我稱之為圖像合成子的方向,這種產(chǎn)品沒法形成用戶的規(guī)模。有些技術(shù)不僅是黑科技開始變成用戶規(guī)模,語音的識別、人臉識別,這兩個(gè)技術(shù)我反復(fù)講它不是讓機(jī)器做判斷做選擇,最后它形成的商業(yè)價(jià)值或者給用戶帶來的變化,還是不夠大的。 能夠看到什么東西,我們作為一個(gè)好奇的群體,我們在想能夠在無人駕駛,這是大家覺得既是黑科技又有很大的用戶規(guī)模,對不起還沒有面世。從這個(gè)維度講,我們會(huì)發(fā)現(xiàn)今天人工智能變成所有人追捧的熱潮,但是并沒有找到一個(gè)既面世又是同時(shí)有巨大用戶規(guī)模和改變世界的技術(shù)。這是在最近兩三年需要發(fā)生的事情。 這個(gè)過程當(dāng)中變得很難,我們能夠做出技術(shù),并且讓技術(shù)領(lǐng)先就是一個(gè)困難的事情。有些技術(shù)剛剛引回國的時(shí)候是領(lǐng)先,還沒等到產(chǎn)品的商業(yè)化,這個(gè)技術(shù)就開始落后了,發(fā)展特別快。保持技術(shù)領(lǐng)先,這是一個(gè)難題。 更難的是把技術(shù)變成產(chǎn)品,讓很多的用戶去受益。更難的是這個(gè)技術(shù)不僅有它的用戶規(guī)模,還可以改變世界,有很大的商業(yè)上的意義,和對世界的沖擊。 今天我分享的是我們在做的一些嘗試。我之前的PPT叫AI這在過河。這個(gè)過河只是從搜狗,我們的想法是第一件事情,我們有這種技術(shù),而且我們把這種技術(shù)用到搜狗的產(chǎn)品里去,很多創(chuàng)業(yè)的公司試圖構(gòu)造新產(chǎn)品。我們大的邏輯使得已經(jīng)讓千家萬戶用到的產(chǎn)品做升級,其實(shí)深度學(xué)習(xí)已經(jīng)通過搜狗武裝到了牙齒。我們主產(chǎn)品大量的使用,比如輸入法就會(huì)用到語音識別和圖像識別的能力,語音識別我們現(xiàn)在一天已經(jīng)做到了用戶規(guī)模有2億次的識別量,7%的搜狗輸入法的用戶會(huì)運(yùn)用到語音識別的技術(shù)。 同時(shí),一天識別生產(chǎn)的語音數(shù)據(jù)量大概進(jìn)入到18萬小時(shí),我們用了400臺服務(wù)器支撐這樣的規(guī)模。打開輸入法可以看到OCR的能力,可以手寫,或者拍照片,我們在做一個(gè)漸進(jìn)的事情。我昨天在硅谷還跟Google他們的核心人在溝通,Google他們講到用深度學(xué)習(xí)可以對于用戶輸入的命令去做分解,以前靠我們?nèi)嗽诶锩娼y(tǒng)計(jì)這些規(guī)則。今天靠深度學(xué)習(xí)做,對搜索引擎的規(guī)則描述,它的準(zhǔn)確率提升了30%,和我們一樣的,已經(jīng)成為搜索引擎排序里面第三重要的因素。 深度學(xué)習(xí)我們在搜索這個(gè)類型的公司里面可以快速推向使用,但是這樣一個(gè)技術(shù)還沒有到顛覆性。符合剛才講的面世了,有黑的技術(shù),有大的用戶規(guī)模,但是并不夠?qū)κ澜缬懈蟮臎_擊。這里面我們還會(huì)做一些新的東西,這是今天我很榮幸可以在極客公園會(huì)場可以跟大家發(fā)布我們一款新的產(chǎn)品。 回到搜狗的邏輯,用戶表達(dá)和獲取信息更簡單,通過輸入法,很多中國人在打字里面提高的效率,搜索讓大家獲得很多信息。通過深度學(xué)習(xí)使得這樣的產(chǎn)品更加聰明和豐滿,還有什么事情可以借助深度學(xué)習(xí)前人的成果,我分享一個(gè)《圣經(jīng)》里面的小故事,關(guān)于通天塔的故事,人類想通過自己的努力構(gòu)造通天塔可以和上帝對話,上帝覺得藐視了他的權(quán)威,因此他讓不同的人,不同的民族去說不同的語言。 由于大家說不同語言,溝通變成了一個(gè)障礙,所以人就沒有能力修建通天塔。這是我經(jīng)常引用的,由于信息不對稱,使得我們難以合力做一件最偉大的事情。這里面不僅是網(wǎng)絡(luò)連接,還有不同民族語言不一樣。 去年11月份Google有一篇論文,把機(jī)器翻譯推到一個(gè)新的高度,我們?nèi)诚肴绻诒磉_(dá),在獲取的時(shí)候能夠讓不同民族的人,包括中文、英文自由交流,可以獲得他們完整的信息,這世界會(huì)因此而變。這樣的使命里面,我會(huì)認(rèn)為如果能夠跨語言進(jìn)行溝通,這樣的一個(gè)技術(shù)進(jìn)步,人類發(fā)明電一樣是很重要的事情,電使得我們生產(chǎn)力得到巨大解放。做到跨語言溝通,地球的文明會(huì)重新改寫,大家戰(zhàn)爭會(huì)變得更少,不同民族之間的交流會(huì)帶來新的文明產(chǎn)生。 這里面我們做了很多的工作,一方面在Google技術(shù)的指引下我們用了這樣的技術(shù),基于類似于深度神經(jīng)元網(wǎng)絡(luò)的翻譯模型,已經(jīng)被我們掌握的非常好。我們有幸和清華有更多的合作,有很多技術(shù)的經(jīng)驗(yàn)融入到我們模型里面。不僅是深度學(xué)習(xí)的網(wǎng)絡(luò)還有其他的合力。 我們比Google更有動(dòng)力和決心去做好翻譯這件事情,Google代表技術(shù)的高度,它在我心中有一種玩票的心態(tài),作為中國人我們非常有意愿要和英語的直接去對話,Google一做就是上百種語言,或者8種語言之間怎么互譯。對它是一種秀肌肉的事情,對于世界上最大的民族,中文我們有非常大的動(dòng)力去真正變成現(xiàn)實(shí)。 在這樣一種動(dòng)力驅(qū)動(dòng)下,我們實(shí)際做的產(chǎn)品的識別準(zhǔn)確度比Google更加高?;谶@樣的事情,我們開始在產(chǎn)品上去發(fā)力,有一些黑科技。我們在去年烏鎮(zhèn)互聯(lián)網(wǎng)大會(huì)上首發(fā)了機(jī)器同傳,在香港科技大學(xué)我們把同聲傳譯帶到實(shí)用。烏鎮(zhèn)的會(huì)我們叫首秀,烏鎮(zhèn)互聯(lián)網(wǎng)大會(huì)說是世界互聯(lián)網(wǎng),但是在座的觀眾基本都是中國人。這個(gè)發(fā)布是一個(gè)概念性的產(chǎn)品,我們在香港科技大學(xué)發(fā)布這個(gè)產(chǎn)品,下面有30%,真正是國外的學(xué)生,沒有提供同傳的設(shè)備,問他們聽懂了嗎,他們說用中文演講的內(nèi)容也可以聽懂。 我們沒有做視頻的宣傳,在網(wǎng)上有一些傳播。這樣的技術(shù)并不符合我剛才的理念,是很好的技術(shù),并不是給所有人去使用。在去年年底,我們把這個(gè)技術(shù)放到搜狗輸入法你在里面敲中文的時(shí)候,只要點(diǎn)一個(gè)鍵,這句話就可以翻譯成英文,再點(diǎn)一個(gè)鍵就可以發(fā)送出去,使得你跟國外的朋友去做聊天或者寫郵件的時(shí)候,變得更加容易,這是我們輸入法增加的功能。 點(diǎn)翻譯鍵就可以得到后面翻譯的結(jié)果,今天我想給大家?guī)淼氖侵耙恢北C?,也是因?yàn)闃O客公園我們準(zhǔn)備的一個(gè)新的產(chǎn)品,在這個(gè)場合下發(fā)布。我們叫做搜狗的海外搜索,能聽到這個(gè)詞一定和跨語言的翻譯工作相關(guān)。它是什么?我們在以前搜索的時(shí)候,中文信息可能只占世界信息的10%,不會(huì)更多了。很多大量優(yōu)質(zhì)的內(nèi)容是在海外,但是很不幸,一個(gè)是Google被封掉,即便我們會(huì)用Google,作為一個(gè)中國人英文水平確實(shí)承認(rèn)不夠高,用中文搜索的時(shí)候沒有更多的信息。我們今天發(fā)布的海外搜索產(chǎn)品,是給中國人用,幫助英文不夠流利,或者還是效率不夠高的朋友,我們實(shí)現(xiàn)了你用中文詞輸入可以翻譯成英文,檢索英文世界的內(nèi)容,同時(shí)把它翻譯成中文。 這個(gè)產(chǎn)品三頁就可以看到左邊是搜索海外的英文內(nèi)容,你點(diǎn)一個(gè)鍵就可以以中文的方式閱讀,而且提供雙語的翻譯??梢愿蓡幔课覀冎翱吹酱罅繉M飧信d趣的事情,細(xì)胞免疫療法,在中國得到很多虛假的信息,可以看到海外怎么說這個(gè)事。人工智能國外發(fā)展,我們可以看人工智能國外初創(chuàng)公司,這個(gè)搜索到的就是國外最前沿的人工智能公司。我們想知道明星lady gaga,我們可以看到在西方世界怎么樣的。 我們可以搜索到90%的世界,這對我們是巨大的促進(jìn)。我們今天首發(fā)這樣的產(chǎn)品,這是搜狗第一次在極客公園首發(fā),而且也是全球第一次把神經(jīng)網(wǎng)絡(luò)元系統(tǒng)和產(chǎn)品相關(guān)的產(chǎn)品能夠給你一個(gè)單獨(dú)的翻譯產(chǎn)品,我們放到搜索里去,就可以使得我們?nèi)ニ阉魅澜绲膬?nèi)容。 右邊有我們的二維號,今天有機(jī)會(huì)給大家做這樣的發(fā)布,歡迎大家來試用。 背后有很多工作要做,這個(gè)翻譯技術(shù)非常的細(xì)膩,有些前沿的詞匯并沒有中英文對應(yīng)。我昨天從美國回來,我查美聯(lián)航空在線值機(jī),翻譯過去再翻回來就變成聯(lián)合航空。我們需要把搜索技術(shù)和網(wǎng)頁搜索做一個(gè)合體,現(xiàn)在是單獨(dú)的海外搜索,之后要和網(wǎng)頁搜索做整合,投入更大的資源,大家可以全面瀏覽不僅是搜索可以做翻譯,使得海外的內(nèi)容可以做到中文閱讀,翻譯之后用中文看到整個(gè)世界。 這里面我們做這個(gè)工作,翻譯技術(shù)如何去解決,我們想到底去做思考未來有什么變化。我們是去取代人類還是幫助人類?在網(wǎng)上有了這樣的討論。取代人類,如果我們的翻譯系統(tǒng)把專業(yè)的翻譯給仍掉了,這個(gè)人群就沒有工作,對更多人是有了幫助。我們反復(fù)討論一個(gè)題目,有了機(jī)器學(xué)習(xí)之后,有了深度學(xué)習(xí)之后,究竟機(jī)器和人是什么關(guān)系?這是我的兩個(gè)思考的結(jié)論。 我在前年極客公園大會(huì)上提到智慧的體外進(jìn)化,有了機(jī)器之后我們要心甘情愿和機(jī)器合體,我和機(jī)器融合,不要孤立看人。我把機(jī)器當(dāng)成我生命中的一部分,我們變得更加強(qiáng)了。你問一只猴子你希望變成人嗎,猴子可能會(huì)茫然,你問一個(gè)人,你希望變成超人嗎,我們可能會(huì)很茫然。 如果我的工作被取代了,是怎么樣的?這幾天我在讀一些哲學(xué)的書,用尼采的思考,他說這個(gè)地球開始變成一個(gè)大的分工,每個(gè)人就像螺絲釘一樣做了一個(gè)局部的事情。比如說翻譯、司機(jī),我們好像找到了一份工作,其實(shí)我們被限制了我們的自由,我們精確在社會(huì)工作中間完成我原有的使命。機(jī)器取代精確的分工之后,是把我們的束縛解放了,要求我們做一些更我創(chuàng)造性的事情,沒有失去就沒有新的獲得。 我愿意把機(jī)器的智能文明帶到人的世界里去,另一方面我們對于已經(jīng)被分工細(xì)化的人有新的解放,強(qiáng)迫我們獲得一種新的自由,去尋找更多創(chuàng)造性的意義。 這是我想闡述的AI和我們之間的關(guān)系。 我給大家放一分鐘時(shí)間的視頻,是我們在烏鎮(zhèn)和香港的視頻。同聲傳譯今天做到的高度,我今天給大家的演講就分享到這,希望海外搜索會(huì)成為第一款面世能夠改變我們生活,也是被廣大用戶使用的人工智能產(chǎn)品,謝謝! |
|