2018年02月18日 野草是小米的超級(jí)版主
一. 華為發(fā)布麒麟 970,人工智能行業(yè)熱潮再起 1. 華為發(fā)布全球首款內(nèi)置 NPU 人工智能處理器-麒麟 970 華為在 IFA2017 大會(huì)上公布的麒麟 970 處理器引起了業(yè)內(nèi)關(guān)注,它的到來徹底打破了唯頻率和核數(shù)崇拜的傳統(tǒng)觀念。 根據(jù)其公開的信息,麒麟 970 處理器采用了 10nm 工藝制程(與蘋果即將發(fā)布用在 iPhone 8 上的 A11 處理器工藝相同),搭載了 Cortex-A73(CPU)、Mali-G72(GPU)和麒麟 NPU(神經(jīng)網(wǎng)絡(luò)處理單元)。 創(chuàng)新在于異構(gòu)與端云結(jié)合。麒麟 970 采用異構(gòu)架構(gòu)完成人工智能處理,芯片括了 CPU(中央處理器)、GPU(圖形處理器)、NPU(神經(jīng)網(wǎng)絡(luò)處理單元)、ISP(圖像信號(hào)處理)、DSP(數(shù)字信號(hào)處理)。 NPU 在實(shí)現(xiàn) AI 上承擔(dān)主要工作,但 CPU、GPU 等也參與處理。未來以異構(gòu)架構(gòu)實(shí)現(xiàn)人工智能將成為主流,這個(gè)異構(gòu) SoC 將成為一個(gè) AI 計(jì)算平臺(tái)。 麒麟 970 的另一創(chuàng)新之處在于端云結(jié)合實(shí)現(xiàn)人工智能,云端智能的優(yōu)勢(shì)在于強(qiáng)大的運(yùn)算能力,基于大數(shù)據(jù)給出大智慧,在策略性輸出上有極大優(yōu)勢(shì)。而端側(cè)在具備了強(qiáng)大的感知能力之后,手機(jī)就會(huì)成為幫助用戶思考的分身和伙伴。兩者達(dá)成平衡與協(xié)調(diào),才是未來終端發(fā)展的出路。 華為麒麟 970 芯片的發(fā)布再次點(diǎn)燃了市場(chǎng)對(duì)人工智能領(lǐng)域的關(guān)注。 2. 人工智能熱潮再起 1946 年,計(jì)算機(jī)誕生;1956 年人工智能(AI)誕生;1969 年互聯(lián)網(wǎng)誕生......近期無論是華為的麒麟 970 芯片,還是 AlphaGo 與柯潔的人機(jī)大戰(zhàn),人工智能領(lǐng)域再度風(fēng)起云涌。 人工智能正席卷安防、人臉識(shí)別、自動(dòng)駕駛等多個(gè)領(lǐng)域。就當(dāng)前的現(xiàn)狀來看,大部分業(yè)內(nèi)人士都認(rèn)為最先被人工智能“革命”的行業(yè)非金融業(yè)莫屬。 曾經(jīng),高盛在紐約總部的美國(guó)現(xiàn)金股票交易柜臺(tái)的交易員曾一度高達(dá) 600 人,而現(xiàn)在偌大的交易大廳卻只有兩個(gè)人值守。 根據(jù)埃森哲今年發(fā)布的報(bào)告《人工智能:助力中國(guó)經(jīng)濟(jì)增長(zhǎng)》預(yù)測(cè),到 2035年人工智能有潛力拉動(dòng)中國(guó)經(jīng)濟(jì)年增長(zhǎng)率上升 1.6 個(gè)百分點(diǎn)。 人工智能將成為一種全新生產(chǎn)要素,與資本、勞動(dòng)力擁有同等重要地位,將成為拉動(dòng)中國(guó)經(jīng)濟(jì)增長(zhǎng)的新動(dòng)力。 而人工智能芯片作為人工智能的核心要素,已成為各國(guó)未來發(fā)展布局的戰(zhàn)略性一環(huán)。 二. 人工智能芯片的崛起之路 1. 什么是人工智能芯片?為什么需要它? 人工智能的實(shí)現(xiàn)依賴三個(gè)要素:算法是核心,硬件和數(shù)據(jù)是基礎(chǔ),芯片就是硬件的最重要組成部分。它其實(shí)包括兩個(gè)計(jì)算過程:1、訓(xùn)練(Train);2、應(yīng)用(Inference)。 為什么需要人工智能芯片?深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)的分支,是當(dāng)前人工智能研究的主流方式。 簡(jiǎn)單說就是用數(shù)學(xué)方法模擬人腦神經(jīng)網(wǎng)絡(luò),用大量數(shù)據(jù)訓(xùn)練機(jī)器來模擬人腦學(xué)習(xí)過程,其本質(zhì)是把傳統(tǒng)算法問題轉(zhuǎn)化為數(shù)據(jù)和計(jì)算問題。 所以對(duì)底層基礎(chǔ)芯片的要求也發(fā)生了根本性改變:人工智能芯片的設(shè)計(jì)目的不是為了執(zhí)行指令,而是為了大量數(shù)據(jù)訓(xùn)練和應(yīng)用的計(jì)算。 2.現(xiàn)在處于弱人工智能、感知智能的初步階段 人工智能的階段可分為弱人工智能、強(qiáng)人工智能、超人工智能;也可分為計(jì)算智能、感知智能、認(rèn)知智能三個(gè)階段。 計(jì)算智能是最初級(jí)的,主要是計(jì)算能力的進(jìn)化,這有賴于算法的優(yōu)化和硬件(CPU 芯片)的技術(shù)進(jìn)步。感知智能有賴于數(shù)據(jù)獲取技術(shù),目前主要有語(yǔ)音識(shí)別和機(jī)器視覺兩種技術(shù)。 認(rèn)知智能是最高級(jí)的形態(tài),也是未來需要突破的方向。目前階段,人工智能處于弱人工智能,剛剛進(jìn)入感知智能時(shí)代。 人工智能發(fā)展進(jìn)程: 3.人工智能已成為各國(guó)戰(zhàn)略布局的重要一環(huán) 根據(jù)騰訊研究院發(fā)布的《中美兩國(guó)人工智能產(chǎn)業(yè)發(fā)展全面解讀》,截止到2017 年 6 月,全球人工智能企業(yè)總數(shù)達(dá)到 2542 家,美國(guó)擁有 1078 家,占據(jù) 42%; 中國(guó)其次,擁有 592 家,占據(jù) 23%。其余 872 家企業(yè)分布在瑞典、新加坡、日本、英國(guó)、澳大利亞、以色列、印度等國(guó)家。 人工智能是當(dāng)前人類所面對(duì)的最為重要的技術(shù)社會(huì)變革,是互聯(lián)網(wǎng)誕生以來的第二次技術(shù)社會(huì)形態(tài)在全球的萌芽,因此也成為各國(guó)戰(zhàn)略布局的重要一環(huán)。 2017 年 7 月,國(guó)務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》,明確了我國(guó)發(fā)展人工智能的戰(zhàn)略目標(biāo):到 2030 年,人工智能核心產(chǎn)業(yè)規(guī)模超過 1 萬(wàn)億元,帶動(dòng)相關(guān)產(chǎn)業(yè)規(guī)模超過 10 萬(wàn)億元。其他各國(guó)也分別從國(guó)家層面對(duì)人工智能產(chǎn)業(yè)進(jìn)行戰(zhàn)略布局。 三、AI 芯片三種技術(shù)路線,ASIC 是終端應(yīng)用的趨勢(shì) 目前適合深度學(xué)習(xí)的人工智能芯片主要有 GPU、FPGA、ASIC 三種技術(shù)路線。 三類芯片代表分別有英偉達(dá)(NVIDIA)的 Tesla 系列 GPU、賽靈思(Xilinx)的 FPGA 和 Google 的 TPU。 1.GPU:最先被引入深度學(xué)習(xí),技術(shù)成熟 圖形處理器 GPU 最初是用在個(gè)人電腦、工作站、游戲機(jī)和一些移動(dòng)設(shè)備上運(yùn)行繪圖運(yùn)算工作的微處理器,可以快速地處理圖像上的每一個(gè)像素點(diǎn)。其海量數(shù)據(jù)并行運(yùn)算的能力與深度學(xué)習(xí)需求不謀而合,因此,被最先引入深度學(xué)習(xí)。 GPU 不是完全代替 CPU,而是兩者分工合作。在 GPU 計(jì)算中 CPU 和 GPU之間是相連的,而且是一個(gè)異構(gòu)的計(jì)算環(huán)境。 這就意味著應(yīng)用程序當(dāng)中,順序執(zhí)行這一部分的代碼是在 CPU 里面進(jìn)行執(zhí)行的,而并行的也就是計(jì)算密集這一部分是在 GPU 里面進(jìn)行。 2.FPGA:具有硬件可編程特點(diǎn),性能出眾壁壘高 FPGA 即場(chǎng)效可編程邏輯閘陣列,一個(gè)出廠后的成品 FPGA 的邏輯塊和連接可以按照設(shè)計(jì)者的需要而改變。 FPGA 是可編程的,而 GPU 由于架構(gòu)固定,硬件原生支持的指令也就固定了。 其可編程性是關(guān)鍵,因?yàn)樗屲浖c終端應(yīng)用公司能夠提供與其競(jìng)爭(zhēng)對(duì)手不同的解決方案,并且能夠靈活地針對(duì)自己所用的算法修改電路。 FPGA 市場(chǎng)前景誘人,但是門檻之高在芯片行業(yè)里無出其右。 ibm、德州儀器、飛利浦、東芝、三星等 60 多家公司先后斥資數(shù)十億美元投入這個(gè)行業(yè),但是最終成功的只有位于美國(guó)硅谷的兩家公司:Xilinx 與 Altera(被 Intel 收購(gòu))。 這兩家公司共占有近 90%的市場(chǎng)份額,專利達(dá)到 6000 余項(xiàng)之多,如此之多的技術(shù)專利也構(gòu)成了極高的技術(shù)壁壘。 賽靈思(Xilinx)表示,相較于僅使用 CPU 的服務(wù)器,使用百度 FPGA 云端服務(wù)器在賽靈思 FPGA 所驅(qū)動(dòng)的服務(wù)器中,提供 10~80 倍的每瓦效能比。 目標(biāo)市場(chǎng)方面,F(xiàn)PGA 成本太高,所以適合對(duì)價(jià)格不是很敏感的地方,比如企業(yè)應(yīng)用,軍事和工業(yè)電子等等。 3.ASIC:未來移動(dòng)端人工智能硬件的方向 ASIC(Application Specific Integrated Circuit)是專用集成電路,是為專門目的而設(shè)計(jì)。 它是應(yīng)特定用戶要求和特定電子系統(tǒng)的需要而設(shè)計(jì)、制造的集成電路。ASIC 的特點(diǎn)是面向特定用戶的需求,ASIC 在批量生產(chǎn)時(shí)與通用集成電路相比具有體積更小、功耗更低、可靠性提高、成本降低等優(yōu)點(diǎn)。 FPGA 上市速度快,但性能較低。ASIC 上市速度慢,需要大量時(shí)間開發(fā),而且一次性成本(光刻掩模制作成本)遠(yuǎn)高于 FPGA,但是性能遠(yuǎn)高于 FPGA且量產(chǎn)后平均成本遠(yuǎn)低于 FPGA。 FPGA 可以完全重配置,但是 ASIC 也有一定的可配置能力,只要在設(shè)計(jì)的時(shí)候就把電路做成某些參數(shù)可調(diào)的即可。 目標(biāo)市場(chǎng)方面,ASIC 由于低成本適合消費(fèi)電子類應(yīng)用,是未來移動(dòng)端人工智能硬件的發(fā)展方向。像大疆無人機(jī)的 Movidius Myriad 芯片、Tesla 汽車自動(dòng)駕駛曾用的 Mobileye 芯片和 Google 的張量處理器 TPU 都是 ASIC 的代表。 四、科技巨頭加緊布局 AI 芯片,寒武紀(jì)躋身國(guó)際前列 全球科技巨頭都在加緊布局 AI 芯片,希望走在科技變革時(shí)代的前線。 NVIDIA 是 AI 芯片的市場(chǎng)領(lǐng)先者,占據(jù)了全球 GPU 70%的市場(chǎng)份額;Intel接連收購(gòu) Altera、Nervana、Movidius,全方位布局 AI 產(chǎn)品; Google 發(fā)布兩代 TPU,從 ASIC 方向進(jìn)軍 AI 芯片市場(chǎng);寒武紀(jì)科技是中科院計(jì)算所孵化的一家獨(dú)角獸公司。2016 年推出了國(guó)際首個(gè)深度學(xué)習(xí)專用處理器芯片(NPU),技術(shù)全球領(lǐng)先。 1.NVIDIA:GPU 龍頭,AI 芯片的市場(chǎng)領(lǐng)先者 目前全球 GPU 行業(yè)的市場(chǎng)份額有超過 70%被英偉達(dá)公司占據(jù)。而應(yīng)用在人工智能領(lǐng)域的可進(jìn)行通用計(jì)算的 GPU 市場(chǎng)則基本被英偉達(dá)公司壟斷。 自 1999 年發(fā)布第一款 GPU 以來,GPU 就成為了英偉達(dá)最為核心的產(chǎn)品,占到了英偉達(dá)總營(yíng)業(yè)收入的八成以上。英偉達(dá)的股價(jià)表現(xiàn)也是十分驚人,2016 年英偉達(dá)的股價(jià)上漲了 228%,過去的 5 年內(nèi)累計(jì)上漲 500%。 2.Intel:全領(lǐng)域布局人工智能產(chǎn)品 2015 年,英特爾以 167 億美元收購(gòu)了 FPGA 制造商 Altera。英特爾斥巨資收購(gòu) Altera 不是來為 FPGA 技術(shù)發(fā)展做貢獻(xiàn)的,而是要讓 FPGA 技術(shù)為英特爾的發(fā)展做貢獻(xiàn)。 表現(xiàn)在技術(shù)路線圖上,就是從現(xiàn)在分立的 CPU 芯片+分立的 FPGA 加速芯片,過渡到同一封裝內(nèi)的 CPU 晶片+FPGA 晶片,到最終的集成 CPU+FPGA 芯片。 預(yù)計(jì)這幾種產(chǎn)品形式將會(huì)長(zhǎng)期共存,因?yàn)榉至⑵骷m然性能稍差,但靈活性更高。 3.Google:發(fā)布兩代 TPU,從 ASIC 方向進(jìn)軍 AI 芯片市場(chǎng) 第一代 TPU 展現(xiàn)出 ASIC 在神經(jīng)網(wǎng)絡(luò)推斷方面的優(yōu)秀性能。谷歌在 2016 年的 I/O 大會(huì)上推出了自己的 AI 芯片——張量處理器 TPU(第一代)。 第二代 TPU 兼具推理+訓(xùn)練。2017 年 5 月 I/O 大會(huì)上,谷歌發(fā)布了第二代TPU—Cloud TPU,峰值性能達(dá)到 180 TFLOPS/s。第一代 TPU 只加速推理,但第二代 TPU 新增了訓(xùn)練的功能。 不僅如此,谷歌的用戶還能通過專門的網(wǎng)絡(luò),在云端利用 TPU 構(gòu)建機(jī)器學(xué)習(xí)的超級(jí)計(jì)算機(jī)。 4.寒武紀(jì):全球 AI 芯片領(lǐng)域第一個(gè)獨(dú)角獸初創(chuàng)公司 寒武紀(jì)科技(Cambricon)是中科院計(jì)算所孵化的一家獨(dú)角獸公司。 2016年推出的寒武紀(jì) 1A 處理器(Cambricon-1A)是世界首款商用深度學(xué)習(xí)專用處理器,其搭載了國(guó)際首個(gè)深度學(xué)習(xí)專用處理器芯片(NPU)(屬于 ASIC),面向智能手機(jī)、安防監(jiān)控、可穿戴設(shè)備、無人機(jī)和智能駕駛等各類終端設(shè)備,并于 2017 年 8 月獲得了包括阿里在內(nèi)的 1 億美元 A 輪融資。 CPU、GPU 與 NPU 相比,會(huì)有百倍以上的性能或能耗比差距。 在若干代表性神經(jīng)網(wǎng)絡(luò)上的實(shí)驗(yàn)結(jié)果表明——寒武紀(jì)的 DianNao 處理器的平均性能超過主流 CPU 核的 100 倍,但是面積和功耗僅為 1/10,效能提升可達(dá)三個(gè)數(shù)量級(jí);DianNao 的平均性能與主流 GPGPU 相當(dāng),但面積和功耗僅為主流GPGPU 百分之一量級(jí)。 5.其他 AI 芯片參與企業(yè) 其他國(guó)內(nèi)外參與 AI 芯片產(chǎn)業(yè)的科技公司及初創(chuàng)企業(yè)如下表。獲取本文完整報(bào)告請(qǐng)百度搜索“樂晴智庫(kù)”。 AI 芯片是人工智能領(lǐng)域的上游,基于 AI 芯片的下游場(chǎng)景應(yīng)用極為豐富,包括安防、消費(fèi)電子、自動(dòng)駕駛、可穿戴設(shè)備等。 |
|