新智元原創(chuàng) 編輯:木青、金磊 【新智元導(dǎo)讀】霍金弟子Alan Yuille在前不久發(fā)表言論稱,至少在計算機視覺領(lǐng)域,深度學習的瓶頸已至。然而,人工智能與大數(shù)據(jù)的發(fā)展是相輔相成的,數(shù)據(jù)將會推動人工智能的發(fā)展,促進更多技術(shù)應(yīng)用落地,將人工智能帶入一個新臺階——數(shù)據(jù)紅利悄然將至。 深度學習已至“瓶頸”?數(shù)據(jù)處理或許是一劑良藥。 前不久,霍金弟子、約翰霍普金斯大學教授Alan Yuille發(fā)表言論稱,至少在計算機視覺領(lǐng)域,深度學習的瓶頸已至。 在此問題上,Alan Yuille認為該領(lǐng)域最嚴峻的挑戰(zhàn)是開發(fā)能夠應(yīng)對組合爆炸的算法,如果研究人員追求更多樣性的方法和技術(shù),而不僅是追逐當前的流行趨勢,這一領(lǐng)域?qū)玫礁斓陌l(fā)展。 而現(xiàn)在,對于深度學習發(fā)展已經(jīng)到了天花板的問題,似乎有了另外的解決方案——數(shù)據(jù)。 英特爾公司架構(gòu)圖形與軟件集團副總裁和數(shù)據(jù)分析技術(shù)總監(jiān)馬子雅 6月18-21日,以“打破理論與現(xiàn)實的壁壘”為主題的O’Reilly和英特爾人工智能大會在京舉行。 大會期間,英特爾公司架構(gòu)圖形與軟件集團副總裁和數(shù)據(jù)分析技術(shù)總監(jiān)馬子雅在被問到如何看待“深度學習到達瓶頸”的問題時表示,人工智能、數(shù)據(jù)分析界在此問題上長期以來有兩派意見: 一派意見認為人工智能的發(fā)展一定要通過對其算法的不斷提升才能真正把AI推到一個新臺階; 另一派意見認為人工智能只做算法是不行的,若是不能更好地利用、分析數(shù)據(jù),人工智能很快就會達到它的瓶頸。 而馬子雅認為,二者是相輔相成的,如同事物發(fā)展規(guī)律曲折回復(fù),其最終結(jié)果會呈上升趨勢。 人工智能一直有所精進,但其應(yīng)用方面并不是非常理想。自從有了大數(shù)據(jù),對圖像分析領(lǐng)域產(chǎn)生了突破性推進作用。 數(shù)據(jù)會推動人工智能的發(fā)展,會將人工智能帶入一個新臺階,部署行業(yè)應(yīng)用,推進人工智能落地: “人工智能業(yè)務(wù)的需求牢牢地根植于數(shù)據(jù),要充分利用以數(shù)據(jù)為中心的基礎(chǔ)架構(gòu),充分利用將數(shù)據(jù)分析與人工智能無縫銜接起來的軟件創(chuàng)新技術(shù)?!?/div> 而圍繞數(shù)據(jù)為核心,英特爾在AI時代的戰(zhàn)略圖景也可通過此次大會有所了解: 在軟件方面,提供一系列通用工具集,幫助用戶最大化利用硬件, 以及通過BigDL和Analytics Zoo構(gòu)建統(tǒng)一的大數(shù)據(jù)分析與人工智能平臺,幫助用戶開發(fā)部署行業(yè)應(yīng)用,推進人工智能落地; 在硬件方面,提供完整的硬件產(chǎn)品組合和計算平臺,滿足用戶從設(shè)備到邊緣再到云端的不同工作負載需求 。 在產(chǎn)、學、研生態(tài)打造方面,英特爾宣布在中國成立大數(shù)據(jù)分析和人工智能創(chuàng)新院,進一步加快集成數(shù)據(jù)分析和AI的大規(guī)模創(chuàng)新與部署。 英特爾人工智能戰(zhàn)略的核心在于,致力于給客戶帶來領(lǐng)先的人工智能硬件和軟件產(chǎn)品組合,幫助用戶搭建所需要的AI應(yīng)用,幫助客戶解決所面臨的個性化問題。除了技術(shù)本身,英特爾還致力于與廣泛的行業(yè)伙伴合作,一起面向共同服務(wù)的客戶,開發(fā)全套、全面、完整的AI解決方案。 在AI時代,英特爾正在完成一次轉(zhuǎn)型——從“芯片航母”到以數(shù)據(jù)為中心,深挖數(shù)據(jù)紅利,釋放數(shù)據(jù)價值,通過軟硬件協(xié)同加速人工智能的行業(yè)應(yīng)用。 低門檻開源工具BigDL、Analytics Zoo,數(shù)據(jù)紅利悄然將至 人類處于一個數(shù)據(jù)變革的時代——歷史上90%的數(shù)據(jù)都是在過去幾年產(chǎn)生的,而50%的數(shù)據(jù)卻是在短短兩年所生成。 在過去的一段時間數(shù)據(jù)分析和人工智能得到了空前的發(fā)展。 但事實上到目前為止,只有2%的數(shù)據(jù)被真正的分析用來幫助人類的生產(chǎn)生活。人工智能是時候走出實驗室了,走向落地應(yīng)用了。 而這一過程需要一條完整的數(shù)據(jù)分析流水線: 第一步,通常需要從生產(chǎn)線上收集大量的原始數(shù)據(jù); 第二步,要對這些原始數(shù)據(jù)進行大量的清理和預(yù)處理; 第三步,利用數(shù)據(jù)分析、機器學習、深度學習對于清理過的數(shù)據(jù)進行歸納總結(jié); 第四步,可視化。 這條流水線有著較高的門檻:20%的任務(wù)是深度學習,但80%都是在做數(shù)據(jù)收集、數(shù)據(jù)存儲、數(shù)據(jù)管理、數(shù)據(jù)清理、數(shù)據(jù)預(yù)處理。 這也正是英特爾開源BigDL、Analytics Zoo的重要原因——降低門檻,讓人工智能走出實驗室。 目前,BigDL和Analytics Zoo都已開源,大大降低了普通大數(shù)據(jù)用戶和數(shù)據(jù)科學家在使用深度學習進行數(shù)據(jù)分析和構(gòu)建人工智能應(yīng)用時的門檻。 GitHub開源地址: https://github.com/intel-analytics/BigDL 先來看看BigDL,BigDL是一個建立在大數(shù)據(jù)平臺(Hadoop/Spark)之上原生的分布式深度學習庫,它提供了在Apache Spark上豐富的深度學習功能,以幫助 Hadoop/Spark成為一個統(tǒng)一的數(shù)據(jù)分析平臺,為整個數(shù)據(jù)分析和機器學習過程提供比現(xiàn)有框架更加統(tǒng)一和集成化的支持。 GitHub開源地址: https://github.com/intel-analytics/analytics-zoo 同時,在Apache Spark、BigDL以及TensorFLow、Keras的基礎(chǔ)上又構(gòu)建了一個大數(shù)據(jù)分析 AI的平臺Analytics Zoo,方便用戶開發(fā)基于大數(shù)據(jù)、端到端的深度學習應(yīng)用。 不止降低了開發(fā)者學習深度學習的門檻,在建立AI生態(tài)上,“釋放數(shù)據(jù)紅利”已經(jīng)逐漸變成現(xiàn)實。 人工智能如果不能真正地效力于生產(chǎn)實踐,其實是沒有任何價值的??次磥淼内厔?,必須先看到人工智能對于未來哪幾個方面能產(chǎn)生比較大的影響。 英特爾通過Analytics Zoo構(gòu)建統(tǒng)一的大數(shù)據(jù)分析和人工智能平臺,幫助用戶開發(fā)部署深度學習、人工智能和大數(shù)據(jù)分析的應(yīng)用,攜手眾多合作伙伴和用戶,共同推動人工智能部署,加速落地。 美的,韻達,歐洲核子研究組織(CERN)都在利用英特爾Analytics Zoo進行人工智能的落地。英特爾借助BigDL和Analytics Zoo幾乎與各行各業(yè)的廠商展開了合作,實施部署了各種各樣的人工智能的解決方案。 這其中就包括智慧醫(yī)療、智慧銀行、智慧交通、智慧生產(chǎn)、智慧電信等等。英特爾也與大型云服務(wù)提供商、原型設(shè)備制造商、軟件開發(fā)商進行合作,將技術(shù)整合產(chǎn)品當中,包括阿里巴巴、百度、騰訊、京東等等。 同時,英特爾還推動與產(chǎn)、學、研的深度合作,打造AI生態(tài)。 在大會上,英特爾宣布啟動英特爾數(shù)據(jù)分析和人工智能研究院創(chuàng)新院。創(chuàng)新院的主要負責人是英特爾高級首席工程師、大數(shù)據(jù)技術(shù)全球CTO戴金權(quán)。 這個創(chuàng)新院的主要工作集中在以下幾點: 第一,加速人工智能在中國市場的落地,尤其是通過將它與數(shù)據(jù)分析進行整合來加速落地。 第二,解決中國市場的最新需求,引領(lǐng)創(chuàng)新,創(chuàng)新用法、創(chuàng)新算法。第三,幫助中國市場更好地使用英特爾最新的軟件和硬件技術(shù)。 AI芯片,絕不能輸?shù)膽?zhàn)場:不局限于CPU,需要研發(fā)多種硬件形式 如今AI芯片已經(jīng)成為一個“絕不能輸?shù)膽?zhàn)場”。 在O’Reilly大會期間,有著“芯片航母”之稱的英特爾在接受媒體采訪時透露了在硬件方面的布局圖景。 馬子雅表示:英特爾的硬件圖景不只集中在計算,我們希望英特爾的硬件能夠比較全面,例如針對存儲方面,英特爾開發(fā)了“傲騰”技術(shù),另外英特爾也已經(jīng)做了很久的網(wǎng)絡(luò)架構(gòu)技術(shù)。 而作為整個產(chǎn)業(yè)的根基,AI芯片如今成為各大巨頭紛紛爭先想要占領(lǐng)的高地。收購Nervana Systems,成為英特爾全面擁抱人工智能的一個重要節(jié)點。 在去年接受新智元采訪時,英特爾全球副總裁兼人工智能產(chǎn)品事業(yè)部總經(jīng)理 Naveen Rao 表示AI 已是英特爾“絕不能輸?shù)膽?zhàn)場”。在2019年1月,英特爾推出了Nervana神經(jīng)網(wǎng)絡(luò)推理處理器。本次馬子雅也透露對于Nervana的未來規(guī)劃公司已有路線圖,會在更合適的機會和大家分享。 馬子雅強調(diào)未來的計算力不能局限于CPU一種,尤其是在AI時代,需要通過研發(fā)多種多樣的硬件形式,保證計算力能夠在固定每幾年翻一番的速度繼續(xù)下去,可能都不是集中在通用芯片上,有時候是專用和通用的結(jié)合。 事實上,盡管CPU不再是“唯一”,但仍然是計算結(jié)構(gòu)里不可或缺的重要組成部分。就如同Naveen Rao此前說得一樣,只要是馮·諾依曼架構(gòu),“你必須要有一個CPU”。 英特爾一大優(yōu)勢在于,市面上已經(jīng)安裝并且投入使用的CPU,而硬件基礎(chǔ)設(shè)施的更新則是逐步進行,“把舊的全扔掉然后換新的”并不現(xiàn)實。如今,全球有3500萬公司使用英特爾的CPU,眼下最火熱的人工智能推理,也有近 90% 是在英特爾的芯片上完成。 英特爾在制程與封裝上仍處于領(lǐng)先位置。制程工藝不斷向更高的晶體管密度發(fā)展,為芯片帶來更強的性能和更低的功耗。擁有領(lǐng)先的制程技術(shù),是構(gòu)建領(lǐng)先硬件產(chǎn)品的關(guān)鍵。 制程的領(lǐng)先仍然是英特爾繼續(xù)發(fā)揮產(chǎn)品優(yōu)勢的關(guān)鍵因素,在10納米領(lǐng)域英特爾繼續(xù)推動產(chǎn)品的發(fā)展。在Foveros的制程中,英特爾的3D封裝技術(shù)可實現(xiàn)在邏輯晶圓上堆疊邏輯處理單元,能夠把邏輯芯片和邏輯芯片連在一起,更好地發(fā)揮異構(gòu)功效。 另外,在CPU的周圍,你可以放上GPU、DSP、ISP,以及NNP,或者各種新的架構(gòu)。 英特爾認為,未來十年架構(gòu)創(chuàng)新會是創(chuàng)新的主要驅(qū)動力,將繼續(xù)帶來指數(shù)級的擴展效應(yīng)。除了常見的標量、矢量、矩陣和空間這四種計算架構(gòu)外,英特爾在架構(gòu)創(chuàng)新上還做了更多的工作,例如: Loihi神經(jīng)擬態(tài)計算。它可以用超低的功耗去完成一個GPU用很高功耗才能完成的任務(wù),并能通過學習得到一個新的網(wǎng)絡(luò)。 量子計算。量子計算是在架構(gòu)上的另外一個全新的超大并行規(guī)模計算。英特爾在量子計算有兩個不同的探索模式,一個是和業(yè)界類似的通過超導(dǎo)方式做量子位和量子芯片;另外一種是基于英特爾比較擅長的硅處理工藝,用自旋的方式,目前也有了(自旋)量子位芯片,并且為了能夠規(guī)?;纳a(chǎn)和測試,專門和產(chǎn)業(yè)界、學術(shù)界合作。 保持CPU王者的領(lǐng)先優(yōu)勢,同時開發(fā)適合AI時代的多種硬件形式,AI化是英特發(fā)展硬件的未來方向。 AI并非“一策萬能”:軟硬件協(xié)同創(chuàng)新,實現(xiàn)超異構(gòu)時代的技術(shù)愿景 事實上,過去幾年間計算力正在以驚人的速率增長。計算力指數(shù)級上升的實現(xiàn),正是基于硬件與軟件的結(jié)合。如果想實現(xiàn)指數(shù)級的增長,必須要硬件和軟件共同創(chuàng)新。 在講述硬件未來圖景時,馬子雅提到需要研發(fā)多種多樣的硬件形式。然而,AI并非“一策萬能”。 沒有一種方案能解決所有問題(one size doesn’t fit all),需要多樣化的產(chǎn)品組合滿足不同人工智能應(yīng)用的需求。 從某種程度上,在人工智能這一領(lǐng)域,英特爾更像是AI解決方案提供者,針對不同的案例提供不同的軟硬件組合: 從軟件層面,英特爾主要集中在開源方面,例如開源BigDL和Analytics Zoo。 未來十年的計算創(chuàng)新由架構(gòu)驅(qū)動。英特爾具備獨具一格的優(yōu)勢,可以將標量(CPU)、矢量(GPU)、矩陣(AI)和空間(FPGA)等不同架構(gòu)整合到系統(tǒng)級平臺和系統(tǒng)級封裝,同時也在進行架構(gòu)創(chuàng)新的新探索,比如Loihi神經(jīng)擬態(tài)計算芯片、量子計算。 而怎樣進行組合則是由客戶的工作負載來決定,決定適的軟件和合適的硬件。 馬子雅透露到,最有效的辦法、為客戶提供最好的解決方案,就是先知道他的工作負載是什么,然后找到相應(yīng)的軟件硬件結(jié)合來解決那個工作負載,這是最行之有效的。 英特爾強調(diào)在硬件上每得到一個指數(shù)級的性能提升,如果加上軟件的話可能有兩個指數(shù)級的性能提升。對于此,英特爾從操作系統(tǒng)再到上層整合成一個完整的全棧軟件技術(shù)(Vertical Stack),然后在硬件架構(gòu)的優(yōu)化全部打通。 通過這種技術(shù)能夠把各種性能,架構(gòu)上所有軟件的性能整合起來然后提供給用戶,大大提高其在這些架構(gòu)上得到的性能和算力。值得一提的是,英特爾“One API”項目將為開發(fā)者帶來一套能提供一個統(tǒng)一編程模型的工具。針對跨多種架構(gòu)的工作負載,這個模型簡化了相關(guān)的開發(fā)工作。 對英特爾而言,就是要提供多樣化的標量、矢量、矩陣和空間架構(gòu)組合,以先進制程技術(shù)進行設(shè)計,由顛覆性內(nèi)存層次結(jié)構(gòu)提供支持,通過先進封裝集成到系統(tǒng)中,使用光速互連進行超大規(guī)模部署,提供統(tǒng)一的軟件開發(fā)接口以及安全功能,從而實現(xiàn)超異構(gòu)計算的技術(shù)愿景。 AI計算如今已經(jīng)邁入超異構(gòu)時代,硬件基礎(chǔ)只是AI超級生態(tài)中的一個環(huán)節(jié),但是以數(shù)據(jù)為中心的未來還需要更完整的系統(tǒng)思考,單一因素已經(jīng)不足以滿足多元化的未來計算需求,必須實現(xiàn)軟硬件協(xié)同創(chuàng)新。 將于7月11日正式召開! 地點:深圳馬哥孛羅好日子酒店 此次大會為開發(fā)者準備了為期一天的AI實踐學習,此大會免費參與,掃描上方二維碼注冊參會。前75位完成線下簽到并全程參加會議的出席者可免費獲得英特爾 神經(jīng)計算棒二代。名額有限,請盡快注冊,收到參會確認函即為報名成功。
|
|