一、什么是算力? 算力即計(jì)算能力(Computing Power)。根據(jù)《中國(guó)算力白皮書(shū)(2022年)》的定義:算力是數(shù)據(jù)中心的服務(wù)器通過(guò)對(duì)數(shù)據(jù)進(jìn)行處理后實(shí)現(xiàn)結(jié)果輸出的一種能力。2023年10月工業(yè)和信息化部等六部門(mén)聯(lián)合印發(fā)的《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)計(jì)劃》中指出:算力是集信息計(jì)算力、網(wǎng)絡(luò)運(yùn)載力、數(shù)據(jù)存儲(chǔ)力于一體的新型生產(chǎn)力。 算力是衡量數(shù)據(jù)中心計(jì)算能力的一個(gè)綜合指標(biāo)。 二、算力的衡量標(biāo)準(zhǔn) 算力(CP)有多種衡量指標(biāo),最常用的算力指標(biāo)是FLOPS(Floating Point Operations Per Second,每秒浮點(diǎn)運(yùn)算次數(shù))。FLOPS已成為各種設(shè)施(如計(jì)算機(jī)、超算機(jī)、服務(wù)器等)衡量計(jì)算性能的代名詞。FLOPS是一個(gè)基本單位,它的更大的數(shù)值單位有K(千)、M(兆)、G(吉)、T(太)、P(拍)、E(艾)等。 ![]() 衡量算力水平,除了運(yùn)算次數(shù)指標(biāo)之外,還需要考慮算力精度。根據(jù)參與運(yùn)算數(shù)據(jù)精度的不同,可把算力分為:雙精度算力(64位,FP64)、單精度算力(32位,FP32)、半精度算力(16位,FP16)及整型算力(INT8、INT4)。算力規(guī)模測(cè)算時(shí),通常統(tǒng)一折算成單精度浮點(diǎn)數(shù)(FP32)算力進(jìn)行統(tǒng)計(jì)。 三、算力(CP)的計(jì)算 數(shù)據(jù)中心算力是數(shù)據(jù)中心內(nèi)所有服務(wù)器算力的加和。那我們?nèi)绾胃鶕?jù)一個(gè)數(shù)據(jù)中心IT電力容量來(lái)估算數(shù)據(jù)中心的算力呢? 1、選定服務(wù)器類(lèi)型,計(jì)算服務(wù)器數(shù)量。 假定某數(shù)據(jù)中心的IT總?cè)萘繛?/span>8000kW,采用H100 GPU模組整機(jī)服務(wù)器滿(mǎn)配,單個(gè)H100 GPU模組功率約10kW。 一個(gè)H100 GPU模組,包含8張GPU卡,理論計(jì)算最大的功耗為6.8kW,分別由以下幾項(xiàng)組成: ![]() =8000kW / 10 kw =800 臺(tái) 2、獲取服務(wù)器GPU算力參數(shù) 根據(jù)《NVIDIA H100 Tensor Core GPU 架構(gòu)白皮書(shū)》,查詢(xún)H100 GPU單卡算力為60TFLOPS(單精度FP32)。 ![]() 2、計(jì)算數(shù)據(jù)中心算力 單臺(tái)服務(wù)器共有8張GPU卡,在忽略CPU算力的情況下,可計(jì)算出數(shù)據(jù)中心的算力規(guī)模為: 數(shù)據(jù)中心算力(CP)=單臺(tái)服務(wù)器算力*服務(wù)器數(shù)量 =60*8*800 =384000 TFLOPS =384 PFLOPS |
|