日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

【寒武紀(jì)深度學(xué)習(xí)處理器重磅發(fā)布】ISCA 2016 頂級論文產(chǎn)業(yè)化

 昵稱2472300 2016-03-17

 新智元原創(chuàng)1

作者:聞菲


AlphaGo與李世石的人機(jī)大戰(zhàn)已經(jīng)落下帷幕,但人工智能的卓越表現(xiàn)相信在很長一段時間內(nèi)都將深駐人心。不過,在目前的硬件條件下,AlphaGo需要使用巨大的計算資源;最高配置的AlphaGo被稱為AlphaGo Distributed,它使用了1920個CPU和280個GPU。

 

“要是用寒武紀(jì)的硬件,只需要一個PC箱就可以運行AlphaGo的機(jī)群?!标愄焓芯繂T笑著說?!斑\算速度也應(yīng)該會更快?!?/p>

 

2016年3月15日,新智元記者參加了中國科學(xué)院計算技術(shù)研究所舉辦的媒體沙龍,計算所體系結(jié)構(gòu)國家重點實驗室未來計算課題組的陳天石研究員介紹了“寒武紀(jì)神經(jīng)網(wǎng)絡(luò)處理器”:


國際上首個深度學(xué)習(xí)處理器架構(gòu)。


第一個“挖坑”的人


深度學(xué)習(xí)是一類借鑒生物的多層神經(jīng)網(wǎng)絡(luò)處理模式所發(fā)展起來的智能處理技術(shù)。微軟、Google、Facebook、阿里、訊飛、百度等公司都廣泛地將這類技術(shù)應(yīng)用于計算機(jī)視覺、語音識別、自然語言處理、音頻識別與生物信息學(xué)等領(lǐng)域。要說深度學(xué)習(xí)的強(qiáng)大,最好的例子,就是開頭提到的AlphaGo這款基于深度學(xué)習(xí)的圍棋程序。

 

但是,深度學(xué)習(xí)的基本操作是神經(jīng)元和突觸的處理,而傳統(tǒng)的處理器指令集(包括 x86 和ARM等)對深度學(xué)習(xí)的處理效率很低,往往需要數(shù)百甚至上千條指令才能完成一個神經(jīng)元的處理。例證就是,谷歌使用了上萬個 x86 CPU核,運行了7天的時間,才訓(xùn)練出一個識別貓臉的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)。

 

因此,神經(jīng)網(wǎng)絡(luò)處理器一直是計算機(jī)硬件領(lǐng)域少有人觸及的課題——哪怕如今AlphaGo讓“神經(jīng)網(wǎng)絡(luò)”這個名詞大紅大紫,深度學(xué)習(xí)也成了世界公認(rèn)的重要智能處理技術(shù)。但是,早在深度學(xué)習(xí)這股熱潮興起之前的2008年,還是博士生的陳天石便注意到神經(jīng)網(wǎng)絡(luò)的存在價值,和同事一起走上了體系結(jié)構(gòu)和人工智能交叉研究的道路,探索神經(jīng)網(wǎng)絡(luò)硬件。交叉領(lǐng)域的研究要得到認(rèn)可并不容易,用陳天石的話說,就是“第一個挖坑”。


即使有這么多人跟進(jìn),我們還是第一


2012年,陳天石等人提出了國際上首個人工神經(jīng)網(wǎng)絡(luò)硬件的基準(zhǔn)測試集benchNN。這項工作提升了人工神經(jīng)網(wǎng)絡(luò)處理速度,有效加速了通用計算,大大推動了國際體系結(jié)構(gòu)學(xué)術(shù)圈對神經(jīng)網(wǎng)絡(luò)的接納度。


此后,陳天石、陳云霽課題組接連推出了一系列不同結(jié)構(gòu)的“寒武紀(jì)”神經(jīng)網(wǎng)絡(luò)專用處理器。2014年,他們在ASPLOS的文章中實現(xiàn)了多個當(dāng)前流行的深度模型,兩獲CCF推薦A類國際學(xué)術(shù)會議的最佳論文獎,并被《美國計算機(jī)學(xué)會通訊》遴選為研究亮點,在深度學(xué)習(xí)的硬件領(lǐng)域邁出了堅實的一步。


2016年3月,陳云霽、陳天石課題組提出的寒武紀(jì)深度學(xué)習(xí)處理器指令集DianNaoYu被計算機(jī)體系結(jié)構(gòu)領(lǐng)域的頂級國際會議ISCA 2016接收,在所有近300篇投稿中排名第一。論文的第一作者為劉少禮博士。

 

DianNaoYu指令直接面對大規(guī)模神經(jīng)元和突觸的處理,一條指令即可完成一組神經(jīng)元的處理,并對神經(jīng)元和突觸數(shù)據(jù)在芯片上的傳輸提供了一系列專門的支持。模擬實驗表明,采用DianNaoYu指令集的深度學(xué)習(xí)處理器相對于 x86指令集的CPU有兩個數(shù)量級的性能提升。



寒武紀(jì)芯片。來源:中科院計算所

 


寒武紀(jì)芯片的板卡。來源:中科院計算所


ISCA(International Symposium on Computer Architecture)被公認(rèn)為是計算機(jī)體系結(jié)構(gòu)領(lǐng)域最重要的國際會議。四十多年來,計算機(jī)硬件的多項核心創(chuàng)新都出自于ISCA,包括RISC、緩存一致性、動態(tài)多發(fā)射等。我國迄今在該會議上發(fā)表論文僅十余篇。自2014年中科院計算所提出首個深度學(xué)習(xí)處理器“寒武紀(jì)”之后,深度學(xué)習(xí)處理器已經(jīng)成為ISCA最為關(guān)注的研究方向之一。ISCA 2016上,有近1/6的論文(來自MIT、斯坦福和UCSD等國際知名機(jī)構(gòu))都引用“寒武紀(jì)”的工作進(jìn)行深度學(xué)習(xí)處理器探索。

 

“我們團(tuán)隊都是土博士,洋人不帶我們玩兒,完全是憑著我們的工作成果才跟隨過來?!标愄焓院赖卣f:“但即使有這么多人跟進(jìn),我們還是第一。”


人工智能的寒武紀(jì)


指令集是計算機(jī)軟硬件生態(tài)體系的核心。Intel 和ARM正是通過其指令集控制了PC和嵌入式生態(tài)體系。寒武紀(jì)在深度學(xué)習(xí)處理器指令集上的開創(chuàng)性進(jìn)展,為中國占據(jù)智能產(chǎn)業(yè)生態(tài)的領(lǐng)導(dǎo)性地位提供了技術(shù)支撐。

 

陳天石研究員特別感謝了“中科院戰(zhàn)略性先導(dǎo)科技專項”,正是有了專項的資金支持,才能讓“寒武紀(jì)”這個國際首個深度學(xué)習(xí)處理器架構(gòu)保有中外專利。

 

據(jù)陳天石透露,與寒武紀(jì)處理器相關(guān)的產(chǎn)業(yè)化工作已經(jīng)啟動,未來幾個月之內(nèi)就會運行寒武紀(jì)公司。接下來,他們將專注于深度學(xué)習(xí)處理器的產(chǎn)業(yè)化運營,主要分為高性能服務(wù)器芯片、高能效終端芯片和服務(wù)機(jī)器人芯片這三方面的轉(zhuǎn)化工作,力求“服務(wù)于民用市場,滿足國家重大需求”。

 

“很多人都問,我們的處理器為什么要叫‘寒武紀(jì)’,”陳天石說:“因為寒武紀(jì)是生物‘大爆炸’的時代,現(xiàn)在也像是人工智能大爆炸的時代?!?/p>

 

“但是,寒武紀(jì)之后地球上也遭遇了生物大滅絕,”他接著說,席間有笑聲響起,“人工智能也會迎來衰退或滅絕期,這是自然規(guī)律”。不過,他希望“寒武紀(jì)”能在接下來的衰退乃至滅絕(如果發(fā)生的話)當(dāng)中存活下來,并且發(fā)展得更好。


“寒武紀(jì)能支持各種智能主機(jī)和終端,進(jìn)一步將應(yīng)用面擴(kuò)展到更多算法上?!?/p>



    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多