當?shù)貢r間4月5日9點,北京時間4月6日凌晨, GPU技術(shù)大會(GTC)在“硅谷之都”圣何塞拉開帷幕。 作為全球最大的圖形處理器(GPU)企業(yè),英偉達(NVIDIA)聯(lián)合創(chuàng)始人兼CEO黃仁勛發(fā)表了長達2個小時的關(guān)于未來計算的演講。 要知道,作為上游GPU企業(yè),英偉達的每一步戰(zhàn)略布局都將在全產(chǎn)業(yè)鏈產(chǎn)生四兩撥千斤的巨大影響。近年來,英偉達一直面臨PC市場整體疲軟的困境,而且與之相關(guān)的GPU游戲業(yè)務(wù)目前仍占公司總營收的八成。受PC市場拖累,英偉達自2012年起股價一直低迷于每股15美元左右。 但是,從去年開始它的股價卻發(fā)生奇跡般的反彈!GTC大會當日收盤于每股35.75美元,和2015年中期的20.90美元相比大漲了70%。 其實,英偉達收入結(jié)構(gòu)并未發(fā)生實質(zhì)性逆轉(zhuǎn),不過一向注重預期的華爾街只為未來買單。那么,黃仁勛究竟向華爾街投資人講述了一個怎樣的全新故事? 業(yè)界從他剛剛2個小時的GTC演講中就可一覽無遺。在黃仁勛發(fā)布的SDK、VR、深度學習芯片、深度學習系統(tǒng)以及深度學習汽車五大戰(zhàn)略方向中,不難發(fā)現(xiàn)一半以上都與人工智能(AI)息息相關(guān)。 看來,這是黃仁勛在和人工智能玩對賭: 贏了,英偉達順利轉(zhuǎn)型,產(chǎn)品版圖開疆擴土,并繼續(xù)受到華爾街青睞; 輸了,英偉達數(shù)十億美元的研發(fā)投入將付之東流,企業(yè)恐怕也將因此陷入泥潭。 去年,微軟超級深度網(wǎng)絡(luò),伯克利大學brett機器人,百度深度演講第二版,智能駕駛引得眾專家紛紛創(chuàng)業(yè),一直到谷歌的AlphaGo戰(zhàn)勝圍棋九段李世石,在人工智能熱炒發(fā)酵的同時也為GPU推開了一道機遇之門。 黃仁勛就直言:“Deep Learning is a big deal.” 的確,由于GPU強大的并行計算能力,它如今已經(jīng)成為人工智能中深度學習的熱門處理器。 GTC大會首日,黃仁勛就發(fā)布了性能英偉達迄今性能最強的超大規(guī)模數(shù)據(jù)中心加速器 NVIDIA Tesla P100 GPU。它采用了五項全新的突破性技術(shù): 全新 Pascal 架構(gòu),相比前一代Maxwell架構(gòu),神經(jīng)網(wǎng)絡(luò)訓練方案性能提升 12 倍。 NVLink高速GPU互聯(lián)技術(shù),帶寬實現(xiàn) 5 倍加速。 全球最大FinFET 芯片,16nm 工藝,153 億個晶體管,獲得更快性能和更佳能效。 Pascal 架構(gòu)將處理器和數(shù)據(jù)封裝,顯存帶寬高達720GB/s,3倍于Maxwell架構(gòu)。 全新人工智能算法,半精度指令為深度學習提供了超過 21 Teraflops 的峰值性能。 黃仁勛認為,傳統(tǒng)計算是“專家+時間”,新型計算是“算法+數(shù)據(jù)+HPC”。為此,英偉達今天還發(fā)布了全球首款深度學習超級計算機NVIDIA DGX-1,它正是基于全新的Tesla P100 GPU 打造,并集成了硬件、深度學習軟件以及開發(fā)工具。 為了卡位人工智能,這個處理器企業(yè)因此跳到了前臺,做起了HPC細分市場的生意,這一模式上的突破令筆者感到驚訝。 據(jù)悉,DGX-1的吞吐量相當于 250 臺 CPU 服務(wù)器。而相比一年前問世的NVIDIA Maxwell架構(gòu)四路解決方案也快了12倍,這意味著深度學習中同樣的學習任務(wù)以前需要25小時,現(xiàn)在僅僅需要2個小時。 當然,這款人工智能專門領(lǐng)域的HPC也價格不菲,建議售價高達12.9萬美元。不過,黃仁勛算了一筆賬:“同樣計算能力的CPU服務(wù)器需要250臺,以每臺1萬美元計算就要250萬美元,服務(wù)器之間連接的網(wǎng)絡(luò)設(shè)備還需要追加50萬美元。” 12.9萬美元vs.300萬美元,單單從價格的數(shù)量級來看,這也無疑是一種創(chuàng)新方案。 據(jù)悉,DGX-1將于今年6月正式推向市場,而同樣搭載了Tesla P100 GPU的IBM、惠普、戴爾的深度學習服務(wù)器預計在2017年第一季度問世。 除了GPU之外,芯片業(yè)的另一熱門當屬FPGA,英特爾還在去年耗資167億美元收購FPGA企業(yè)Altera。兩種不同領(lǐng)域的技術(shù)因為人工智能的出現(xiàn)出現(xiàn)了交集的可能,那么專注GPU的英偉達怎么看呢? 黃仁勛一手拿著Tesla M40,一手拿著Tesla M4,回應(yīng)說:“沒有理由使用FPGA或者專用芯片。我們的GPU不僅高效節(jié)能,而且是通用架構(gòu),可以進行轉(zhuǎn)碼、圖像處理、深度學習。這兩款產(chǎn)品已經(jīng)成為我們增長最快的業(yè)務(wù),被全球的互聯(lián)網(wǎng)企業(yè)所采用?!?/span> 前者提供后臺的計算性能,專為訓練深度學習神經(jīng)網(wǎng)絡(luò)設(shè)計,后者則定位為低功耗小巧型加速器,用于機器學習前端圖像與視頻的采集處理和傳輸。 據(jù)悉,谷歌和國內(nèi)的百度、阿里和京東等互聯(lián)網(wǎng)企業(yè)都在應(yīng)用Tesla M系列GPU。 如果說此次英偉達通過發(fā)布全球首款深度學習超級計算機NVIDIA GTX-1,而從處理器后臺跳到了前臺,那么從2007年發(fā)布并行架構(gòu)軟件平臺CUDA開始,黃仁勛就不再認為英偉達是家純粹的GPU企業(yè)了。在今天的GPU大會上,黃仁勛一開場也是這樣強調(diào):“我們是一家軟件公司”。 在戰(zhàn)略新品發(fā)布環(huán)節(jié)當中,其實,軟件部分是黃仁勛今天最先發(fā)布的——NVIDIA SDK系列更新。 這些更新包括NVIDIA CUDA 8。英偉達并行計算平臺的最新版本可以讓開發(fā)者直接使用Pascal架構(gòu)一系列的全新特性,包括統(tǒng)一內(nèi)存和 NVLink。該版本還包括全新的圖表分析庫 nvGRAPH,后者可用于機器人路徑規(guī)劃、網(wǎng)絡(luò)安全和物流分析,將 GPU 加速的應(yīng)用擴展到大數(shù)據(jù)分析領(lǐng)域。 英偉達還發(fā)布了cuDNN v5,一個 GPU 加速的深度神經(jīng)網(wǎng)絡(luò)基元庫,可提供Pascal GPU支持、循環(huán)神經(jīng)網(wǎng)絡(luò)和用于醫(yī)療、油氣和其他行業(yè)的增強特性。 據(jù)悉,cuDNN的深度學習框架,包括谷歌的TensorFlow、加州大學伯克利分校的Caffe、蒙特利爾大學的Theano和紐約大學的Torch,這些又驅(qū)動亞馬遜、臉譜和谷歌等所用的深度學習解決方案的運行。 也正因為有了來自于CUDA的軟件基礎(chǔ),今天奪人眼球的全球首款深度學習HPC才得以從GPU躍升為可以直接使用的產(chǎn)品。因為作為系統(tǒng),它必須包括全面的深度學習軟件套件,比如NVIDIA深度學習GPU訓練系統(tǒng) (DIGITS)以及cuDNN v5等,使得研究人員和數(shù)據(jù)科學家能夠快速便捷地訓練深度神經(jīng)網(wǎng)絡(luò)。 GTC大會上,全球首款深度學習HPC,全新Pascal架構(gòu)GPU,成熟的深度學習框架,這些人工智能領(lǐng)域的創(chuàng)新是否能讓轉(zhuǎn)型期的英偉達持續(xù)獲得華爾街的信任? 畢竟,轉(zhuǎn)型就是一場有關(guān)自身未來的對賭游戲,而黃仁勛為英偉達選擇了與人工智能對賭。 翔snowman 原創(chuàng)出品 公眾號轉(zhuǎn)載需注明來源 科技茱比莉 有視角的科技觀察 有態(tài)度的科技評論
|
|