深度學習已至“瓶頸”？英特爾：數(shù)據(jù)處理是一劑良藥

安喜的空間 2019-06-23

展開全文

新智元原創(chuàng)

編輯：木青、金磊

【新智元導(dǎo)讀】霍金弟子Alan Yuille在前不久發(fā)表言論稱，至少在計算機視覺領(lǐng)域，深度學習的瓶頸已至。然而，人工智能與大數(shù)據(jù)的發(fā)展是相輔相成的，數(shù)據(jù)將會推動人工智能的發(fā)展，促進更多技術(shù)應(yīng)用落地，將人工智能帶入一個新臺階——數(shù)據(jù)紅利悄然將至。

深度學習已至“瓶頸”？數(shù)據(jù)處理或許是一劑良藥。

前不久，霍金弟子、約翰霍普金斯大學教授Alan Yuille發(fā)表言論稱，至少在計算機視覺領(lǐng)域，深度學習的瓶頸已至。

在此問題上，Alan Yuille認為該領(lǐng)域最嚴峻的挑戰(zhàn)是開發(fā)能夠應(yīng)對組合爆炸的算法，如果研究人員追求更多樣性的方法和技術(shù)，而不僅是追逐當前的流行趨勢，這一領(lǐng)域?qū)玫礁斓陌l(fā)展。

而現(xiàn)在，對于深度學習發(fā)展已經(jīng)到了天花板的問題，似乎有了另外的解決方案——數(shù)據(jù)。

英特爾公司架構(gòu)圖形與軟件集團副總裁和數(shù)據(jù)分析技術(shù)總監(jiān)馬子雅

6月18-21日，以“打破理論與現(xiàn)實的壁壘”為主題的O’Reilly和英特爾人工智能大會在京舉行。

大會期間，英特爾公司架構(gòu)圖形與軟件集團副總裁和數(shù)據(jù)分析技術(shù)總監(jiān)馬子雅在被問到如何看待“深度學習到達瓶頸”的問題時表示，人工智能、數(shù)據(jù)分析界在此問題上長期以來有兩派意見：

一派意見認為人工智能的發(fā)展一定要通過對其算法的不斷提升才能真正把AI推到一個新臺階；

另一派意見認為人工智能只做算法是不行的，若是不能更好地利用、分析數(shù)據(jù)，人工智能很快就會達到它的瓶頸。

而馬子雅認為，二者是相輔相成的，如同事物發(fā)展規(guī)律曲折回復(fù)，其最終結(jié)果會呈上升趨勢。

人工智能一直有所精進，但其應(yīng)用方面并不是非常理想。自從有了大數(shù)據(jù)，對圖像分析領(lǐng)域產(chǎn)生了突破性推進作用。

數(shù)據(jù)會推動人工智能的發(fā)展，會將人工智能帶入一個新臺階，部署行業(yè)應(yīng)用，推進人工智能落地：

“人工智能業(yè)務(wù)的需求牢牢地根植于數(shù)據(jù)，要充分利用以數(shù)據(jù)為中心的基礎(chǔ)架構(gòu)，充分利用將數(shù)據(jù)分析與人工智能無縫銜接起來的軟件創(chuàng)新技術(shù)?！?/div>

而圍繞數(shù)據(jù)為核心，英特爾在AI時代的戰(zhàn)略圖景也可通過此次大會有所了解：

在軟件方面，提供一系列通用工具集，幫助用戶最大化利用硬件, 以及通過BigDL和Analytics Zoo構(gòu)建統(tǒng)一的大數(shù)據(jù)分析與人工智能平臺，幫助用戶開發(fā)部署行業(yè)應(yīng)用，推進人工智能落地；

在硬件方面，提供完整的硬件產(chǎn)品組合和計算平臺，滿足用戶從設(shè)備到邊緣再到云端的不同工作負載需求。

在產(chǎn)、學、研生態(tài)打造方面，英特爾宣布在中國成立大數(shù)據(jù)分析和人工智能創(chuàng)新院，進一步加快集成數(shù)據(jù)分析和AI的大規(guī)模創(chuàng)新與部署。

英特爾人工智能戰(zhàn)略的核心在于，致力于給客戶帶來領(lǐng)先的人工智能硬件和軟件產(chǎn)品組合，幫助用戶搭建所需要的AI應(yīng)用，幫助客戶解決所面臨的個性化問題。除了技術(shù)本身，英特爾還致力于與廣泛的行業(yè)伙伴合作，一起面向共同服務(wù)的客戶，開發(fā)全套、全面、完整的AI解決方案。

在AI時代，英特爾正在完成一次轉(zhuǎn)型——從“芯片航母”到以數(shù)據(jù)為中心，深挖數(shù)據(jù)紅利，釋放數(shù)據(jù)價值，通過軟硬件協(xié)同加速人工智能的行業(yè)應(yīng)用。

低門檻開源工具BigDL、Analytics Zoo，數(shù)據(jù)紅利悄然將至

人類處于一個數(shù)據(jù)變革的時代——歷史上90%的數(shù)據(jù)都是在過去幾年產(chǎn)生的，而50%的數(shù)據(jù)卻是在短短兩年所生成。

在過去的一段時間數(shù)據(jù)分析和人工智能得到了空前的發(fā)展。

但事實上到目前為止，只有2%的數(shù)據(jù)被真正的分析用來幫助人類的生產(chǎn)生活。人工智能是時候走出實驗室了，走向落地應(yīng)用了。

而這一過程需要一條完整的數(shù)據(jù)分析流水線：

第一步，通常需要從生產(chǎn)線上收集大量的原始數(shù)據(jù)；

第二步，要對這些原始數(shù)據(jù)進行大量的清理和預(yù)處理；

第三步，利用數(shù)據(jù)分析、機器學習、深度學習對于清理過的數(shù)據(jù)進行歸納總結(jié)；

第四步，可視化。

這條流水線有著較高的門檻：20%的任務(wù)是深度學習，但80%都是在做數(shù)據(jù)收集、數(shù)據(jù)存儲、數(shù)據(jù)管理、數(shù)據(jù)清理、數(shù)據(jù)預(yù)處理。

這也正是英特爾開源BigDL、Analytics Zoo的重要原因——降低門檻，讓人工智能走出實驗室。

目前，BigDL和Analytics Zoo都已開源，大大降低了普通大數(shù)據(jù)用戶和數(shù)據(jù)科學家在使用深度學習進行數(shù)據(jù)分析和構(gòu)建人工智能應(yīng)用時的門檻。

GitHub開源地址：

https://github.com/intel-analytics/BigDL

先來看看BigDL，BigDL是一個建立在大數(shù)據(jù)平臺（Hadoop/Spark）之上原生的分布式深度學習庫，它提供了在Apache Spark上豐富的深度學習功能，以幫助 Hadoop/Spark成為一個統(tǒng)一的數(shù)據(jù)分析平臺，為整個數(shù)據(jù)分析和機器學習過程提供比現(xiàn)有框架更加統(tǒng)一和集成化的支持。

GitHub開源地址：

https://github.com/intel-analytics/analytics-zoo

同時，在Apache Spark、BigDL以及TensorFLow、Keras的基礎(chǔ)上又構(gòu)建了一個大數(shù)據(jù)分析 AI的平臺Analytics Zoo，方便用戶開發(fā)基于大數(shù)據(jù)、端到端的深度學習應(yīng)用。

不止降低了開發(fā)者學習深度學習的門檻，在建立AI生態(tài)上，“釋放數(shù)據(jù)紅利”已經(jīng)逐漸變成現(xiàn)實。

人工智能如果不能真正地效力于生產(chǎn)實踐，其實是沒有任何價值的?？次磥淼内厔?，必須先看到人工智能對于未來哪幾個方面能產(chǎn)生比較大的影響。

英特爾通過Analytics Zoo構(gòu)建統(tǒng)一的大數(shù)據(jù)分析和人工智能平臺，幫助用戶開發(fā)部署深度學習、人工智能和大數(shù)據(jù)分析的應(yīng)用，攜手眾多合作伙伴和用戶，共同推動人工智能部署，加速落地。

美的，韻達，歐洲核子研究組織（CERN）都在利用英特爾Analytics Zoo進行人工智能的落地。英特爾借助BigDL和Analytics Zoo幾乎與各行各業(yè)的廠商展開了合作，實施部署了各種各樣的人工智能的解決方案。

這其中就包括智慧醫(yī)療、智慧銀行、智慧交通、智慧生產(chǎn)、智慧電信等等。英特爾也與大型云服務(wù)提供商、原型設(shè)備制造商、軟件開發(fā)商進行合作，將技術(shù)整合產(chǎn)品當中，包括阿里巴巴、百度、騰訊、京東等等。

同時，英特爾還推動與產(chǎn)、學、研的深度合作，打造AI生態(tài)。

在大會上，英特爾宣布啟動英特爾數(shù)據(jù)分析和人工智能研究院創(chuàng)新院。創(chuàng)新院的主要負責人是英特爾高級首席工程師、大數(shù)據(jù)技術(shù)全球CTO戴金權(quán)。

這個創(chuàng)新院的主要工作集中在以下幾點：

第一，加速人工智能在中國市場的落地，尤其是通過將它與數(shù)據(jù)分析進行整合來加速落地。

第二，解決中國市場的最新需求，引領(lǐng)創(chuàng)新，創(chuàng)新用法、創(chuàng)新算法。第三，幫助中國市場更好地使用英特爾最新的軟件和硬件技術(shù)。

AI芯片，絕不能輸?shù)膽?zhàn)場：不局限于CPU，需要研發(fā)多種硬件形式

如今AI芯片已經(jīng)成為一個“絕不能輸?shù)膽?zhàn)場”。

在O’Reilly大會期間，有著“芯片航母”之稱的英特爾在接受媒體采訪時透露了在硬件方面的布局圖景。

馬子雅表示：英特爾的硬件圖景不只集中在計算，我們希望英特爾的硬件能夠比較全面，例如針對存儲方面，英特爾開發(fā)了“傲騰”技術(shù)，另外英特爾也已經(jīng)做了很久的網(wǎng)絡(luò)架構(gòu)技術(shù)。

而作為整個產(chǎn)業(yè)的根基，AI芯片如今成為各大巨頭紛紛爭先想要占領(lǐng)的高地。收購Nervana Systems，成為英特爾全面擁抱人工智能的一個重要節(jié)點。

在去年接受新智元采訪時，英特爾全球副總裁兼人工智能產(chǎn)品事業(yè)部總經(jīng)理 Naveen Rao 表示AI 已是英特爾“絕不能輸?shù)膽?zhàn)場”。在2019年1月，英特爾推出了Nervana神經(jīng)網(wǎng)絡(luò)推理處理器。本次馬子雅也透露對于Nervana的未來規(guī)劃公司已有路線圖，會在更合適的機會和大家分享。

馬子雅強調(diào)未來的計算力不能局限于CPU一種，尤其是在AI時代，需要通過研發(fā)多種多樣的硬件形式，保證計算力能夠在固定每幾年翻一番的速度繼續(xù)下去，可能都不是集中在通用芯片上，有時候是專用和通用的結(jié)合。

事實上，盡管CPU不再是“唯一”，但仍然是計算結(jié)構(gòu)里不可或缺的重要組成部分。就如同Naveen Rao此前說得一樣，只要是馮·諾依曼架構(gòu)，“你必須要有一個CPU”。

英特爾一大優(yōu)勢在于，市面上已經(jīng)安裝并且投入使用的CPU，而硬件基礎(chǔ)設(shè)施的更新則是逐步進行，“把舊的全扔掉然后換新的”并不現(xiàn)實。如今，全球有3500萬公司使用英特爾的CPU，眼下最火熱的人工智能推理，也有近 90% 是在英特爾的芯片上完成。

英特爾在制程與封裝上仍處于領(lǐng)先位置。制程工藝不斷向更高的晶體管密度發(fā)展，為芯片帶來更強的性能和更低的功耗。擁有領(lǐng)先的制程技術(shù)，是構(gòu)建領(lǐng)先硬件產(chǎn)品的關(guān)鍵。

制程的領(lǐng)先仍然是英特爾繼續(xù)發(fā)揮產(chǎn)品優(yōu)勢的關(guān)鍵因素，在10納米領(lǐng)域英特爾繼續(xù)推動產(chǎn)品的發(fā)展。在Foveros的制程中，英特爾的3D封裝技術(shù)可實現(xiàn)在邏輯晶圓上堆疊邏輯處理單元，能夠把邏輯芯片和邏輯芯片連在一起，更好地發(fā)揮異構(gòu)功效。

另外，在CPU的周圍，你可以放上GPU、DSP、ISP，以及NNP，或者各種新的架構(gòu)。

英特爾認為，未來十年架構(gòu)創(chuàng)新會是創(chuàng)新的主要驅(qū)動力，將繼續(xù)帶來指數(shù)級的擴展效應(yīng)。除了常見的標量、矢量、矩陣和空間這四種計算架構(gòu)外，英特爾在架構(gòu)創(chuàng)新上還做了更多的工作，例如：

Loihi神經(jīng)擬態(tài)計算。它可以用超低的功耗去完成一個GPU用很高功耗才能完成的任務(wù)，并能通過學習得到一個新的網(wǎng)絡(luò)。

量子計算。量子計算是在架構(gòu)上的另外一個全新的超大并行規(guī)模計算。英特爾在量子計算有兩個不同的探索模式，一個是和業(yè)界類似的通過超導(dǎo)方式做量子位和量子芯片；另外一種是基于英特爾比較擅長的硅處理工藝，用自旋的方式，目前也有了（自旋）量子位芯片，并且為了能夠規(guī)?；纳a(chǎn)和測試，專門和產(chǎn)業(yè)界、學術(shù)界合作。

保持CPU王者的領(lǐng)先優(yōu)勢，同時開發(fā)適合AI時代的多種硬件形式，AI化是英特發(fā)展硬件的未來方向。

AI并非“一策萬能”：軟硬件協(xié)同創(chuàng)新，實現(xiàn)超異構(gòu)時代的技術(shù)愿景

事實上，過去幾年間計算力正在以驚人的速率增長。計算力指數(shù)級上升的實現(xiàn)，正是基于硬件與軟件的結(jié)合。如果想實現(xiàn)指數(shù)級的增長，必須要硬件和軟件共同創(chuàng)新。

在講述硬件未來圖景時，馬子雅提到需要研發(fā)多種多樣的硬件形式。然而，AI并非“一策萬能”。

沒有一種方案能解決所有問題（one size doesn’t fit all），需要多樣化的產(chǎn)品組合滿足不同人工智能應(yīng)用的需求。

從某種程度上，在人工智能這一領(lǐng)域，英特爾更像是AI解決方案提供者，針對不同的案例提供不同的軟硬件組合：

從軟件層面，英特爾主要集中在開源方面，例如開源BigDL和Analytics Zoo。

未來十年的計算創(chuàng)新由架構(gòu)驅(qū)動。英特爾具備獨具一格的優(yōu)勢，可以將標量（CPU）、矢量（GPU）、矩陣（AI）和空間（FPGA）等不同架構(gòu)整合到系統(tǒng)級平臺和系統(tǒng)級封裝，同時也在進行架構(gòu)創(chuàng)新的新探索，比如Loihi神經(jīng)擬態(tài)計算芯片、量子計算。

而怎樣進行組合則是由客戶的工作負載來決定，決定適的軟件和合適的硬件。

馬子雅透露到，最有效的辦法、為客戶提供最好的解決方案，就是先知道他的工作負載是什么，然后找到相應(yīng)的軟件硬件結(jié)合來解決那個工作負載，這是最行之有效的。

英特爾強調(diào)在硬件上每得到一個指數(shù)級的性能提升，如果加上軟件的話可能有兩個指數(shù)級的性能提升。對于此，英特爾從操作系統(tǒng)再到上層整合成一個完整的全棧軟件技術(shù)（Vertical Stack），然后在硬件架構(gòu)的優(yōu)化全部打通。

通過這種技術(shù)能夠把各種性能，架構(gòu)上所有軟件的性能整合起來然后提供給用戶，大大提高其在這些架構(gòu)上得到的性能和算力。值得一提的是，英特爾“One API”項目將為開發(fā)者帶來一套能提供一個統(tǒng)一編程模型的工具。針對跨多種架構(gòu)的工作負載，這個模型簡化了相關(guān)的開發(fā)工作。

對英特爾而言，就是要提供多樣化的標量、矢量、矩陣和空間架構(gòu)組合，以先進制程技術(shù)進行設(shè)計，由顛覆性內(nèi)存層次結(jié)構(gòu)提供支持，通過先進封裝集成到系統(tǒng)中，使用光速互連進行超大規(guī)模部署，提供統(tǒng)一的軟件開發(fā)接口以及安全功能，從而實現(xiàn)超異構(gòu)計算的技術(shù)愿景。

AI計算如今已經(jīng)邁入超異構(gòu)時代，硬件基礎(chǔ)只是AI超級生態(tài)中的一個環(huán)節(jié)，但是以數(shù)據(jù)為中心的未來還需要更完整的系統(tǒng)思考，單一因素已經(jīng)不足以滿足多元化的未來計算需求，必須實現(xiàn)軟硬件協(xié)同創(chuàng)新。

將于7月11日正式召開！

地點：深圳馬哥孛羅好日子酒店

此次大會為開發(fā)者準備了為期一天的AI實踐學習，此大會免費參與，掃描上方二維碼注冊參會。前75位完成線下簽到并全程參加會議的出席者可免費獲得英特爾神經(jīng)計算棒二代。名額有限，請盡快注冊，收到參會確認函即為報名成功。