日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

互聯(lián)網(wǎng)大數(shù)據(jù)發(fā)展深度研究報告

 昵稱26194610 2015-09-24



2015年8月14日,由中國科協(xié)、中國科學院指導,中國人工智能學會發(fā)起主辦的第五屆中國智能產(chǎn)業(yè)高峰論壇在上海順利召開。


下面是百度研究院副院長張潼的發(fā)言,本文由中國人工智能學會供稿,靜沙龍記者王嘉俊整理。

【張潼】我們知道“數(shù)據(jù)量日益增多”這是一個背景,可能每十年要增長一千倍。以前可能僅是線下數(shù)據(jù)的增加,而現(xiàn)在為什么互聯(lián)網(wǎng)在數(shù)據(jù)量增加的作用反而更大了呢?這是因為在今天大數(shù)據(jù)的驅(qū)動很大程度上是來源于互聯(lián)網(wǎng)公司,包括:互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)。今后可能還會有傳感器網(wǎng),云端等一系列。但是有一個共同前提,這就是“數(shù)據(jù)量日益增多”。


“云”的概念,大家現(xiàn)在都很熟悉了,包括:IBM等一系列公司,都對“云”投入都是非常巨大的。還有和我們這個會議有關(guān)的,就是人工智能等等一些。李德毅院士講的非常好,現(xiàn)在的智能基本上是用大數(shù)據(jù)驅(qū)動的,所以我把它叫“大數(shù)據(jù)智能”。其中一個很重要的是:機器學習,現(xiàn)在很多領(lǐng)域在人工智能包括在產(chǎn)業(yè)上,都有一系列的應用。


一個方面就是大數(shù)據(jù)在人工智能上的應用,這個跟我們的會議比較相關(guān)。另外一個方面,就是它的一些創(chuàng)新的應用已經(jīng)其將來的趨勢。

從大數(shù)據(jù)我們要看未來或者今天,從發(fā)展上,我覺得主要會有三個趨勢。


其一就是“個性化”。其實從整體來講,我們要談到大數(shù)據(jù),包括大家看一些大數(shù)據(jù)的書籍都會講到這個趨勢,大數(shù)據(jù)的應用使我們了解每一個人,包括:有個很經(jīng)典的例子,比如:一家美國公司,一位父親接到了一個郵件,說他女兒懷孕了什么的。然后他就很生氣找郵件發(fā)送者說到:我的女兒還沒有結(jié)婚等等一些。最后說郵件發(fā)送方只能說:“這個我們可能錯了”,但是實際上最后發(fā)現(xiàn)自己是對的,而那位父親是錯了。從這個例子上,我們可以得知:用數(shù)據(jù)大家能夠非常精準的知道,甚至可能比大家身邊的人知道的更多。

其二就是:智能化。智能化在整個的大數(shù)據(jù)發(fā)展是非常重要的。當然,其中可能一個關(guān)鍵因素是由于智能化是一個更加底層的技術(shù)。


第三個方面就是:產(chǎn)業(yè)化。比如:互聯(lián)網(wǎng)+、工業(yè)4.0等等一系列可以掛鉤,可以更廣泛。所以說,在后面的報告中,我會著重講這三方面。從“個性化”來講,往往是針對個人的;對于每一個人,“產(chǎn)業(yè)化”是對于工業(yè)的,“智能化”算是一個底層的技術(shù)。

5_錕斤拷錕?.jpg


我們先說一下“個性化”。大數(shù)據(jù)在“個性化”的發(fā)展趨勢也是包括幾點。之前,我們討論了個“性化營銷”,個性化營銷在互聯(lián)網(wǎng)應用中是非常重要的技術(shù),也是互聯(lián)網(wǎng)打廣告,包括我剛才講的例子都算是個性化營銷,所以在這里面“個性化”起到了非常強的作用。還有在未來,個性化在醫(yī)療很重要的一個方面應用。因為我個人覺得,雖然在現(xiàn)在醫(yī)療中,大家沒有提及“個性化”,但將來、未來會起到非常大的作用。包括美國有一些類似于這樣的“個性化”計劃,都是針對于醫(yī)療。

而在將來、現(xiàn)在也是發(fā)生的,“個性化的服務”。怎么去利用個性化,更廣泛地做更全面的服務。我可能會主要講“個性化營銷”這一塊,“個性化營銷”就是其中有一個。比如:在互聯(lián)網(wǎng)公司里面,舉個例子,大家要是“個性化”,反映在什么地方呢?比如:他對于用戶可以有很好的理解,通過大家的行為,包括:如果是傳統(tǒng)的零售商,通過其購買行為,比如:通過網(wǎng)上的一些行為等。比如:阿里有用戶的電商數(shù)據(jù),百度有用戶的搜索數(shù)據(jù),這些都是用戶的行為。通過用戶的一系列,告訴用戶這個人到底是什么樣子的,你喜歡什么,將來可能更有傾向去對什么更感興趣,這個是一種所謂我們叫“用戶畫像”。把給刻畫出來,這是一個最主要的形式。有了客戶畫像以后,就可以做個性化的推薦和個性化的廣告。


這里面大家要知道,像廣告是一個非常大的、重要的在支撐互聯(lián)網(wǎng)企業(yè)的一個模式,就是商業(yè)模式。比如:百度基本上所有的收益都是來自于廣告,阿里很大部分收益也是來自于廣告,騰訊現(xiàn)在的廣告業(yè)務也是慢慢起來更多,騰訊還有游戲業(yè)務。


在這里,“個性化”起到非常重要的作用,我們能夠精準的知道每個人想要什么,這樣可以更好的推薦。如果用戶要知道自己的用戶興趣,然后可以針對某一個用戶更好的展現(xiàn)。其中有一個技術(shù),廣告的點擊行為技術(shù),這里就需要用到“機器學習”知識。

在百度公司中,所涉及到的數(shù)據(jù)量可以到千億級,而服務器數(shù)量上也是上萬臺的。對于機器學習而言,就如同當時像李院士提到的大數(shù)據(jù)智能是一個核心,其前提是大數(shù)據(jù),后面才有一系列的機器學習。這包括:用戶可以有很好的計算,可以有更復雜的模型等。其次還包括:有很好的算法、在現(xiàn)有的時間內(nèi)、現(xiàn)有的計算時間有很好的結(jié)果等。

說到大數(shù)據(jù)在智能化上會起到的作用,這是一個未來的十年之內(nèi)比較大的趨勢。其中重要的一點:就是機器學習的能力。 


諸如:百度等很多公司,都會投入很多的力量把大數(shù)據(jù)的智能化應用,就是將其作為做前沿研究,并設(shè)計實現(xiàn)更好的學習系統(tǒng)。還有一點就是:把這樣的能力變成實際應用,即:做智能化的系統(tǒng)。從機器學習能力來看,到目前為止有一個比較經(jīng)典的案例可以看出大數(shù)據(jù)在機器學習上的作用。

關(guān)于大數(shù)據(jù)機器學習案例包括:圖像分類,ImageNet。在我們之前做了一些機器學習的模型都是基于淺層的模型,當時在這個數(shù)據(jù)上取得了百分之七十幾的準確率。幾年之內(nèi),它的錯誤率從20%幾可以降到5%、6%。


我們用了大數(shù)據(jù)和復雜的模型,你需要有GPU等等一系列的更好的計算,更好的高效的算法,這樣你就得出了一個非常強的系統(tǒng),這個系統(tǒng)可以支持你的智能化。這里的智能化不僅是圖像識別,還包括:語音、廣告等等一系列,現(xiàn)在都是有這種智能化趨勢。我們希望如果要是做這種底層的技術(shù),能夠產(chǎn)生智能的技術(shù),我們希望把數(shù)據(jù)量加大,希望嘗試更為復雜的模型,希望把計算能夠在同等計算能力的情況下,能做更強的計算。這幾個趨勢,是目前很多的研究方向,而使我們整個的智能技術(shù)等方面得以集體提升。


對于百度本身來講,搜索引擎技術(shù)其實就是一個智能化系統(tǒng)。它會為了提升用戶體驗,包括將來的“自動應答”體驗等,也包括商業(yè)變現(xiàn)的廣告系統(tǒng)等等一系列應用。

在此,我認為智能化的技術(shù)在未來有一些關(guān)鍵的方面,特別是在人和物理世界相交換,機器能夠從虛擬世界到物理世界的連接,包括機器人等等一系列;其中之一就是感知技術(shù)。比如:圖像識別,語音識別等等一系列,還有自然語言識別等。


然后,用戶要能夠理解對方的意義,把他變成一個“表示”,而這個“表示”就是能夠自動的進行推理。另外一個關(guān)鍵點就是交互,對于智能化系統(tǒng)而言,其交互技術(shù)的實現(xiàn)也是非常重要的。所謂的交互就是用戶和人進行的一個交流;尤其可見,“表示”和“交互”就是一個是使你能夠更好的理解另外一個也是可以輔助的關(guān)系。最后還有一個就是用戶決策。決策就是需要用戶做的事情,用戶能產(chǎn)生行動或者產(chǎn)生一個相應。這個包括:用戶連接本身人還有其它的知識,這里面包括:用戶要做分析、做決策等等,然后最后產(chǎn)生一個結(jié)果。其實搜索也是有類似的技術(shù),或許將來可以有更好的其他技術(shù)。


我舉個例子,搜索目前你就是輸入文字進去,這是最主要的形式,其實,我們還可以用語音或者圖像搜索。另外,用戶還要把清楚語意。目前在搜索上交互用的比較少,但是實際上是應該有的。一方面,交互就是你搜了一個選項或者關(guān)鍵詞以后,也許用戶還會知道其它的方面內(nèi)容提示,它(搜索引擎)會提示到:也許用戶檢索的是另外一個關(guān)鍵詞或者是選詞等等。然后,從行動上來講,搜索就是根據(jù)所有的信息內(nèi)容,包括之前的信息提示給用戶做最好的搜索結(jié)果。

從這個方面來看,現(xiàn)在這些形式在搜索上其實是相對簡單的。將來這里面可以做的更好的形式,這時候“更好”的一個就是設(shè)計者可以做出一個趨勢,你要說機器人也行,說助理也行。可能大家都知道的話,也是因為動畫片《大白》這里面是個人的健康助理,它是一個垂直領(lǐng)域的。


百度也在做一些嘗試,有一個比如:小度機器人。這些嘗試希望可以集成到更好的,更加智能化的,然后可以有更好的用戶體驗,它可以比搜索引擎要更加進步的能力。對于技術(shù)方面,比如:要更個性化,包括我們前面提到的大數(shù)據(jù)個性化,包括“認知技術(shù)”,用戶怎么去感知和交流。如果有這么一個助理的話,他希望和用戶交流,包括:要資源整合。然后,我們可以有分析,接著處理一些需求。這里資源整合的意思,就是用戶要知道什么地方有東西能夠滿足客戶的需求,這個資源可以是線上資源,也可以是線下資源,然后搜索引擎會有這種努力。所以未來、將來就會有更加好的形式,能夠滿足用戶想要知道的事情。

另外一個趨勢,就是大數(shù)據(jù)的產(chǎn)業(yè)化。產(chǎn)業(yè)化其實有很多,包括:廣告營銷實際上算是一類,這跟“個性化”關(guān)聯(lián)非常強。還有人工智能技術(shù),人工智能技術(shù)也可能會產(chǎn)業(yè)化。另外就是大數(shù)據(jù)對于產(chǎn)業(yè)升級,還有整體社會上的作用。當然,產(chǎn)業(yè)化還有一些對科學技術(shù)將來會有非常大的影響,所以我這里還要討論一下在互聯(lián)網(wǎng)以及大數(shù)據(jù)技術(shù)對于產(chǎn)業(yè)上,對于社會變革能夠有一些什么作用和影響。

這里面產(chǎn)業(yè)化,我覺得也是有幾個重要的機會點,這個機會點其實在各個領(lǐng)域現(xiàn)在都有人在嘗試,后面我也會舉一些例子。

其一,做智能連接,這是最早提出做“互聯(lián)網(wǎng)+”的本意?;ヂ?lián)網(wǎng)本身還是從把人連接到某種事情,是做智能的連接?,F(xiàn)在希望人連到線下資源。


其二,人機互補。大數(shù)據(jù)的智能技術(shù)要幫助人來輔助決策,就是人和計算機交流,而不是說計算機完全解決。也就是說:讓人做原來做不了的事情,這使得人變的也很重要,但是計算機是能夠輔助人。

最后是數(shù)據(jù)創(chuàng)新。其實所有的這幾個事情的核心就是“提升效率”,這是因為傳統(tǒng)的方式做事情有一些低效的地方。你就想在什么情況下是低效的,我們怎么能夠提升效率、改變效率而使其變得高效,這是最核心的地方。

而如果要是任何對我們想要知道機會的時候,進行這個思考,只要你覺得什么地方有機會能夠提高效率,都應該是值得去嘗試、值得去做的,所以這里面也是有很多的機會。實際上從互聯(lián)網(wǎng)的思維,是連接的思維。它是把互聯(lián)網(wǎng)從連接線上到線上,到連接線上到線下??梢宰鲆恍┓?,比如:可以做醫(yī)療、出行、餐飲等等一系列的。怎么去用互聯(lián)網(wǎng)增加它的效率?這是它的核心點,把效率增加。

一個例子,中國有嘀嘀,國外是Uber,它是連接人和車。這個大家可能都熟悉,但是其中有一個智能技術(shù)就是“智能發(fā)單”,當客戶人過來了,他去要一個車,他周圍可能有很多個車,但是客戶需要知道哪一個車是最合適的,最大的優(yōu)化效率,或者最愿意接單,或者是其整個的環(huán)境更好。

還有一塊是“智能定價”,在Uber還是比較典型的,比如:上下班的時候定價會高。這些東西從本意,都是提升整體的行業(yè)效率。還有就是智能的需求,他能知道什么地方可能更好,告訴出租車司機客戶可能去哪個地方等等一系列。像Uber買了CMU的一個整個實驗室,他們想做智能駕駛,如果真的做成了,將來就直接用無人車來接就行了。

實際上像這種新興的互聯(lián)網(wǎng)公司,像Uber這樣的實際上既是一個大數(shù)據(jù)公司,也是一個人工智能公司,而且還有很多的技術(shù)含量在這其中。

另外一個是“人機互補”,美國也是有一個比較重要的公司在做這件事情,就是Palantir。大家如果看到過《從0到1》,也應該對Palantir科技比較熟悉。的確他們已經(jīng)在很多地方在用了這樣的技術(shù),他們的思路就是用人和機。機器不是解決所有的問題,但是機器可以和人相對配合,用人快速的定位信息,快速的查找相關(guān)信息,幫助人來做決策。所以人能夠很快的,從海量的信息里找到最關(guān)鍵的信息,找到最合適的信息,然后幫助用戶來實現(xiàn)其所需要的目標。


Palantir公司還去找一些保險金融的欺詐,這是他們原始的,因為原來他們做過一些金融欺詐的一系列的工作。這說明:首先,人機互補要包含了很多技術(shù),一個就是大數(shù)據(jù)的技術(shù)在這里面,然后還有智能的查詢,可視化的技術(shù)、關(guān)聯(lián)分析,異常報警。如果你要用大數(shù)據(jù)輔助人,這些都是一些比較重要的數(shù)據(jù)。

百度也做過一些類似的應用,比如:用百度的地圖數(shù)據(jù),能夠做一些相關(guān)的互補,包括“智能城市管理”。比如:用戶可以做人口管理、城市優(yōu)化、城市網(wǎng)絡分析優(yōu)化等等。百度本身是有定位數(shù)據(jù),所以他知道人去了哪兒,他完全不需要知道外面的,只是從百度的數(shù)據(jù)人在地圖上搜了些什么地方,他去了哪兒。這也屬于人機交互、人機輔助的思想。

包括用戶可以對上海的外灘事件進行分析,也做過類似的嘗試。

包括:用戶可以做智能選址。商業(yè)需要知道在哪個地方最合適開一個店怎么辦?這里面也是可以運用這些數(shù)據(jù),做輔助決策。這是一個很大的方向。

還有一些大數(shù)據(jù)的發(fā)展趨勢就是“行業(yè)創(chuàng)新”。行業(yè)創(chuàng)新里面,用大數(shù)據(jù)怎么去把原來一些行業(yè)不是很高效的地方變得更高效?

這里面我想說一點:當時百度曾經(jīng)做了一系列的預測項目,我們也是輔助一些各個地方,其中有一個就是旅游景點的預測。比如:現(xiàn)在這個景點里面有很多的人,然后我們來預測人數(shù)等等一系列。當時還有一些報道。

還有一個就是我們做的一些關(guān)于大數(shù)據(jù)在醫(yī)療上的一些創(chuàng)新。互聯(lián)網(wǎng)也是愿意切入醫(yī)療,其實醫(yī)療主要有三個方面應用;一個就是病前,可能是用戶希望知道一些基本信息。

另外就是患者就醫(yī),就醫(yī)現(xiàn)在的一個痛點就是“掛號”。也在嘗試怎么利用互聯(lián)網(wǎng)的方式解決掛號的問題。還有康復,康復包括一系列用戶需要查詢等等一系列的一些交互等等。


從我們研究來看,開始的就是從問診開始。如果用戶要是有一種疾病,他就會去咨詢;但是很多情況下,很多病人都會愿意在互聯(lián)網(wǎng)上去咨詢。但是搜索現(xiàn)在這種形式并不是最好的,所以我們嘗試的一個,就是說是把這個變得更加高效,而且更加自然。一方面:就是設(shè)計一套預診系統(tǒng)。這一系列的流程并不是為了取代醫(yī)生的,是為了給病人更好的體驗,使他了解更多的疾病診療信息。

其次,就是嘗試打通關(guān)于和零售業(yè)的一些線上和線下的交流。零售業(yè)關(guān)心的一個主要問題是如何帶來客戶,然后才是怎么維持客戶。一方面從線上和線下的角度來考慮這個問題,從線下的客戶,我們可以幫助找到他線上的行為;而線上的行為,當然零售業(yè)用的是線下的數(shù)據(jù),這里面不但有線下的數(shù)據(jù)也有線上的數(shù)據(jù)。線上的數(shù)據(jù)可以找到相似的客戶,知道這些商家什么客戶對他的價值最高,這樣可以帶來新客戶,而且價值是更高的。

未來的社會將是怎么樣子?如果我們要是從大數(shù)據(jù)的角度來講,一方面是“個性化”。這里的個性化提到的就是當數(shù)據(jù)足夠多,如果用戶要是有個地方有能力做這些數(shù)據(jù)的整合,這個當然難度還是比較大的,因為數(shù)據(jù)有很多問題,一個大的問題就是數(shù)據(jù)孤島。雖然用戶有好多不同的數(shù)據(jù),這些數(shù)據(jù)沒法整合在一起。但是如果我們做到這一點,機器也許比用戶更知道他自己,或者比你周邊的人更知道你自己。


另外一個方面就是:“智能化”。智能化將來可以幫助使用者從人來講,可以更好的來理解自己、幫助自己和進行交流,幫用戶做決策。 也許有一些工作可能機器會替代人工,包括人工駕駛。這里指的不完全是替代,也許是輔助人工,包括我們剛才提到的輔助決策??傮w來講,它會比人工的效率更高。


最后一方面就是“產(chǎn)業(yè)化”,產(chǎn)業(yè)化一塊“科學性”,在本報告中,我就沒有過多涉及到,但是科學的發(fā)展我相信在大數(shù)據(jù)的年代會有加速的發(fā)展且會使其有更大的提升。最后一個方面就是“產(chǎn)業(yè)的升級”。產(chǎn)業(yè)升級包括:傳統(tǒng)產(chǎn)業(yè)的連接項,現(xiàn)在的“互聯(lián)網(wǎng)+”,包括產(chǎn)業(yè)在工業(yè)上的應用。


    本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多