![]() ![]() ![]()
GPU微架構(gòu)包括:流處理器、渲染核、雙精度浮點運算單元、特殊運算單元、流式多處理器、紋理處理器、圖形處理器、流處理器陣列。 ![]() GPU架構(gòu)工作流程為:Vertex Shader(定點著色器)建立圖形骨架,再通過算法轉(zhuǎn)化進行光柵化計算,進而進行紋理映射,再由PixeShader(像素著色器)像素處理,最終由ROP(光柵化引擎)輸出。 ![]() 不同微架構(gòu)決定了GPU的不同性能,英偉達、AMD等國際GPU廠商均加大投入研發(fā)新架構(gòu)作為提升GPU核心競爭力的重要抓手。 以英偉達的GPU架構(gòu)為例: 英偉達的GPU架構(gòu)演進從2010年到2024的14年間,進行了9次大的微架構(gòu)更新,在2024 年3月的GTC大會上,NVIDIA 發(fā)布了 Blackwell 架構(gòu),從 Pascal 架構(gòu)到 Blackwell 架構(gòu),架構(gòu)代號均以科學家人名來命名,分別如下圖所示。 其計算能力跟隨英偉達的GPU微架構(gòu)的發(fā)展,表現(xiàn)出不同的計算性能,具體的微架構(gòu)的運行原理和特點這里就不展開講了。 ![]() ![]() 三、GPU性能評估 GPU性能是衡量GPU運行、執(zhí)行命令高效的重要指標。GPU物理性能評估主要在于比較各硬件的物理參數(shù),評估物理性能的參數(shù)主要包括:微架構(gòu)、制程、圖形處理器數(shù)量、流處理器數(shù)量、顯存容量/位寬/帶寬/頻率、核心頻率。 一般行業(yè)內(nèi)評估GPU性能的指標依次為:微架構(gòu)/制程>流處理器數(shù)量/核心頻率>顯存帶寬/容量>其他。 ![]() 微架構(gòu):目前英偉達的微架構(gòu)在行業(yè)內(nèi)做得最好的,目前也進行了9次大的微架構(gòu)更新,性能有了大大的改變,詳見第二節(jié)內(nèi)容。 制程:指GPU集成電路的密集度。在晶體管硬件數(shù)量一定的情況下,更精細的制程能夠減少功耗和發(fā)熱。現(xiàn)階段GPU主流最先進工藝制程為4nm。 核心頻率:代表GPU顯示核心處理圖像頻率大小/工作頻率,能夠反映顯示核心的性能。 ![]() 圖形處理器單元數(shù)量:指GPU內(nèi)部圖形處理單元,涵蓋光柵單元(ROP)和紋理單元(TMU)等數(shù)量。 光柵單元(ROP):進行光線、反射計算,負責游戲中高分辨率、高畫質(zhì)的效果生成。 紋理單元(TMU):能夠?qū)ΧM制的圖形進行一系列翻轉(zhuǎn)、縮放變化,再將其紋理傳輸至3D平面模型中。 CUDA核數(shù):作為GPU內(nèi)部的流處理器,是主要的計算單元,CUDA核數(shù)越多,GPU性能等級越高Tensor核數(shù):能夠進行張量核加速GEMM計算以及加速卷積和遞歸神經(jīng)網(wǎng)絡運行,Tensor核數(shù)越多,在人工智能、深度學習領(lǐng)域的性能越強。 ![]() 顯存容量:顯存作為GPU核心部件,用以臨時存儲未處理數(shù)據(jù)。顯存容量的大小對于GPU存儲臨時數(shù)據(jù)的多少起決定性作用,在GPU核心性能能夠提供充足支撐前提下,越大的顯存容量能夠減少數(shù)據(jù)讀取次數(shù),減少延遲出現(xiàn)。 顯存位寬:是GPU在單位時鐘周期內(nèi)傳送數(shù)據(jù)的最大位數(shù),位數(shù)越大GPU的吞吐量越大。 顯存頻率:顯存數(shù)據(jù)傳輸?shù)乃俣燃达@存工作頻率,通常以MHz為顯存頻率計數(shù)單位。 顯存帶寬:顯存帶寬=顯存頻率X顯存位寬18,為顯存與顯卡芯片間數(shù)據(jù)傳輸量。 ![]() ![]() ![]() ![]() GPU產(chǎn)業(yè)鏈主要包括三大環(huán)節(jié):設(shè)計、制造和封裝 ![]() GPU整體商業(yè)模式包括三種:IDM和、Fab+Fabless和Foundry
如果對算力不是很熟悉的話,建議可先看看以下的文章,先對算力及相關(guān)的技術(shù)有個基本的了解,歡迎點贊收藏。 一文徹底搞懂:什么是InfiniBand(IB)網(wǎng)絡【干貨】 一文徹底搞懂:什么是RDMA技術(shù)及其三個協(xié)議 一文讀懂:NVlink和NVSwitch技術(shù)及發(fā)展 |
|
來自: yi321yi > 《系統(tǒng)》