兩年前,《麻省理工科技評論》曾經(jīng)率先報道過一項來自清華大學(xué)微電子所 的智能芯片學(xué)術(shù)突破——思考者(Thinker)多模態(tài)神經(jīng)網(wǎng)絡(luò)計算芯片,稱其為“至上突破”(a crowning achievement)。
如今,當(dāng)年這項研究中的核心技術(shù)——可重構(gòu)計算——已經(jīng)走出實驗室。 以清華微電子所可重構(gòu)計算團(tuán)隊為背景于 2018 年成立的新公司“清微智能”(清代表清華,微代表微電子),在不久前的阿里云棲平頭哥生態(tài)論壇,發(fā)布其全球首款可重構(gòu)多模態(tài)智能芯片“TX510”。
在眼下行業(yè)紛紛推出專用 AI 芯片的大潮中,這顆面向通用計算而問世的 AI 芯片,似乎是個異類。 未來 AI 會究竟走向通用計算還是專用計算?
在這個巨大懸念之上,可以看到的是,一眾人馬在不斷地提升工藝,這自然能提升芯片性能,但隨著摩爾定律逐漸趨緩,在后摩爾時代,底層架構(gòu)創(chuàng)新也已呈現(xiàn)來勢洶洶、異軍突起之勢。
“可重構(gòu)計算”:清華團(tuán)隊13年的芯片底層架構(gòu)創(chuàng)新 作為一種架構(gòu)創(chuàng)新,可重構(gòu)計算可根據(jù)算法和應(yīng)用的不同靈活配置硬件資源,執(zhí)行不同的任務(wù),同時具備通用芯片的靈活性和專用集成電路的高效性。
就像是芯片領(lǐng)域的“變形金剛”:硬件跟著軟件變,軟硬件雙編程,“兵來將擋,水來土掩”。

圖|云棲現(xiàn)場展示的 TX510(來源:清微智能) 隨著云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)等技術(shù)的發(fā)展,需要芯片具有更強(qiáng)的算力;萬物智能孕育了巨大的市場需求,但這個市場碎片化,需求具有多樣性,這要求芯片更靈活,更高效,能夠適應(yīng)不同的應(yīng)用場景,同時,在對功耗敏感的場景下,依然能夠保持一個較高的算力,可重構(gòu)計算被寄予厚望以滿足這樣的需求。
而這也正是可重構(gòu)計算在國際上備受重視的原因:《國際半導(dǎo)體技術(shù)路線圖》稱可重構(gòu)技術(shù)是最具前景的未來計算架構(gòu)。美國國防部高級研究計劃局從 2017 年開始,投入巨大精力支持“運行時快速重構(gòu)”的硬件架構(gòu)研究。
不過,美國比較成型的研究和產(chǎn)品開發(fā)大概在 2016 年左右出現(xiàn)。在可重構(gòu)技術(shù)的研究上,中國并不是跟隨者:可重構(gòu)計算是一種全新的芯片架構(gòu)技術(shù),擁有完全中國自主知識產(chǎn)權(quán)。
領(lǐng)導(dǎo)清華可重構(gòu)計算研究的清華大學(xué)微電子學(xué)研究所所長魏少軍教授也曾公開表示,“可重構(gòu)計算芯片技術(shù)是集成電路領(lǐng)域非常有希望的差異化技術(shù),具有廣泛適用性。”
乍看之下,可重構(gòu)計算和當(dāng)下的主流做法異構(gòu)計算有些類似,異構(gòu)計算同樣會調(diào)用不同的計算單元去執(zhí)行各單元擅長的任務(wù)。
但事實上,兩者并不相同。清微智能首席科學(xué)家、清華大學(xué)微電子副教授尹首一在接受 DeepTech 獨家專訪時解釋道:“異構(gòu)計算相對容易,因為 CPU、DSP 等都是現(xiàn)成的,將它們集成在一起即可??芍貥?gòu)計算是更底層的計算架構(gòu)技術(shù)創(chuàng)新,本身具有挺高的技術(shù)含量和門檻?!?/span>

圖|清微智能首席科學(xué)家、清華大學(xué)微電子所副所長尹首一教授(來源:清微智能) 清華微電子團(tuán)隊從 2006 年開始研究可重構(gòu)計算。在成立公司之前,團(tuán)隊總共在實驗室內(nèi)開發(fā)了共四顆芯片,并進(jìn)行了技術(shù)驗證。且自研究的初始,團(tuán)隊的目標(biāo)就是朝向通用計算。
“可重構(gòu)計算使得芯片有能力去做通用計算,諸如 DSP、FPGA 這種相對通用的處理任務(wù),都能很好在重構(gòu)計算上完成,從 2015 年開始,我們把這個技術(shù)應(yīng)用到一些AI計算中,發(fā)現(xiàn)它也能發(fā)揮出很好的效果??芍貥?gòu)計算這個技術(shù)本身的特點驗證了它能夠處理通用計算”,他說。 2016 年,第一顆基于可重構(gòu)計算的芯片在清華的實驗室中誕生。
當(dāng)時的成果也以論文的形式發(fā)表在行業(yè)的頂刊 IEEE Journal of Solid-State Circuits(《IEEE固態(tài)電路期刊》),也正是那時候,《麻省理工科技評論》英文版專門報道了那顆芯片。
“經(jīng)過實驗室的多次驗證以后,我們基本上對技術(shù)已經(jīng)非常自信了,花了一些時間繼續(xù)打磨,并對商業(yè)以及落地的方向,整個技術(shù)與產(chǎn)品模式做了規(guī)劃,差不多在 2017 年開始籌備公司,2018 年公司成立”,他說。
成立之后,清微智能于去年推出第一款產(chǎn)品語音芯片“TX210”,主要面向智能耳機(jī)。最新帶來的 TX510,不僅支持視覺智能處理,也支持語音智能處理。典型功耗為 400mW,峰值算力達(dá) 1.2TOPS@INT8,支持混合精度計算和稀疏神經(jīng)網(wǎng)絡(luò),AI 計算有效能效比達(dá) 5.6TOPS/W@INT8。 圖|可重構(gòu)計算的特點(來源:清微智能)
“多模態(tài)”定義的未來計算任務(wù) 拆分最新問世的 TX510 芯片,除了核心的“可重構(gòu)”之外,另一個重點在于“多模態(tài)”的計算。
多模態(tài)則是指,其面向的計算任務(wù)的類型的多樣性,一方面包括深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的圖像算法、語音算法,另一方面,除了 AI 算法之外,還可以執(zhí)行經(jīng)典算法諸如傳統(tǒng)的視頻信號處理算法等。
現(xiàn)場展示的一款智能門鎖應(yīng)用,就是一個需要這種能力的場景。當(dāng)然,這種“多模態(tài)”的能力同樣源于可重構(gòu)計算這一底層的基礎(chǔ)架構(gòu)創(chuàng)新。不過尹首一認(rèn)為,廣義來看,凡是需要語音,或者更高精度身份識別的場景,都可以應(yīng)用 TX510。
尹首一指出,未來 AI 應(yīng)用發(fā)展走向多元化,帶來的計算任務(wù)也將是多元的,一款芯片產(chǎn)品應(yīng)該同時可以進(jìn)行經(jīng)典計算、AI 計算,在 AI 計算中也可以跑不同類型的算法,而回歸到真正的計算任務(wù)角度, AI 計算本質(zhì)上也需要很多不同類型的算法合作。
“以人臉識別為例,其中除了神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)的算法,還有很多圖像處理的算法。圖像要縮放、旋轉(zhuǎn)、對齊,這些屬于經(jīng)典的信號處理。因此,從應(yīng)用的角度來說,即使它是 AI 應(yīng)用,也應(yīng)當(dāng)具備相對通用的計算能力,才能真正地完成任務(wù),否則只是一個單純的神經(jīng)網(wǎng)絡(luò)加速器,不足以支撐一個完整的應(yīng)用”,他說。

圖|現(xiàn)場展示的人臉識別門鎖應(yīng)用(來源:DeepTech) 為了更好地面向未來的視覺場景,TX510 搭載了時下熱門的 3D 結(jié)構(gòu)光引擎,據(jù)介紹可支持單、雙目 3D 結(jié)構(gòu)光,3D 活體檢測、紅外活體檢測、可見光活體檢測等,可以抵御照片、視頻等二維攻擊,面具等三維攻擊。誤識率千萬分之一的情況下識別率大于 90%,大大高于指紋誤識率五萬分之一的安全指標(biāo),響應(yīng)時間不超過 30ms。
3D 視覺是目前計算機(jī)視覺的一個熱門產(chǎn)業(yè)話題,同樣是經(jīng)過了非常多年的積累,早期主要用于運動捕捉,近幾年得益于技術(shù)的成熟實現(xiàn)了主布的小型化,價值結(jié)構(gòu)光傳感器的發(fā)展,3D 視覺的應(yīng)用開始得以小型化,能夠被集成到諸如手機(jī)等小型設(shè)備上?;?3D 結(jié)構(gòu)光引擎可以實現(xiàn)深度視覺信息的處理,3D 人臉識別、工業(yè)場景中的空間建模,也將是這款芯片的應(yīng)用場景。
“我們認(rèn)為,將來所有用到視覺的地方可能都會是 3D 視覺,因為人的視覺本身是立體的,3D 信息背后還隱藏著很多信息,3D 智能視覺肯定是未來的必然趨勢,只是現(xiàn)在還受限于一些應(yīng)用場景或者產(chǎn)品開發(fā)問題”,他說。
但 TX510 的 3D 結(jié)構(gòu)光引擎中,3D 視覺深度生成的相關(guān)算法并未采用一眾視覺算法公司的解決方案,而是團(tuán)隊自研。

圖|TX510 芯片架構(gòu)(來源:清微智能)
|