AMD首個40nm GPU誕生,主流顯卡你選誰?

40nm先拔頭籌,AMD RV740誕生:
不可否認(rèn),55nm制造工藝為AMD和NVIDIA兩個顯示核心巨頭的產(chǎn)品,帶來了明顯的進(jìn)步,功耗的降低、頻率的提升都讓其顯卡產(chǎn)品充分的得到了優(yōu)化。業(yè)內(nèi)第一款采用55nm制造工藝的RV670來自AMD,2007年11月,首款采用55nm制造工藝的Radeon HD3800顯卡就與大家見面了,而NVIDIA采用相同工藝的產(chǎn)品卻在7個月以后才悄然問世。
在第一代DirectX 10 GPU R600問世后,低下的架構(gòu)執(zhí)行效率成為了困擾AMD的巨大阻礙,R600的失敗,讓AMD不得不面臨著重新規(guī)劃GPU產(chǎn)品的策略,于是從RV670開始,AMD在R600的基礎(chǔ)上進(jìn)行了充分的優(yōu)化,讓僅擁有256bit顯存控制器的Radeon HD3800系列與Radeon HD2900的性能站在了相同的高度,并且利用“雙芯合璧”的方式在頂級顯卡市場與NVIDIA進(jìn)行著對抗,而RV770則是更加肯定了AMD的新策略,Radeon HD4800系列奪回了不少市場,而這些成功的前提,與采用新顯卡制造工藝是密不可分的,既然架構(gòu)效率不及NVIDIA,那么只有領(lǐng)先的制造工藝才能用更低的成本去迎戰(zhàn)強(qiáng)大的競爭對手,何況RV770的性能讓NVIDIA也著實嚇了一跳!

不斷擴(kuò)充的龐大顯示核心架構(gòu)對制造工藝的要求在不斷提升,只有采用新的制造工藝,才能夠在有限的面積內(nèi)融入更多晶體管,從而使性能得到提升,并且將功耗控制在人們能夠接受的范圍里。在第一款55nm制造工藝GPU誕生一年半以后的今天,AMD攜手全新的40nm GPU來了……
與55nm GPU一樣,首款采用40nm制造工藝的顯示核心仍然屬于AMD,這些都源自于AMD務(wù)實的市場策略。

599-799元再添新軍,新老顯卡你會選誰?
RV740顯卡未到來之前,AMD Radeon HD4830以及NVIDIA GeForce 9800GT一直在599-799元左右的市場爭奪份額,在這個價格范圍中,你會選擇哪款產(chǎn)品呢?
40nm打造RV740,核心架構(gòu)全面解析
比RV770核心面積減少13%
雖然RV740采用了先進(jìn)的制造工藝,但核心架構(gòu)方面,RV740仍然沿用了RV770的架構(gòu)體系,RV740的晶體管數(shù)量比RV770下降了13%,核心面積的減少取決于三個方面:
1、核心制造工藝由55nm提升至40nm
2、流處理器數(shù)量的減少,800SP減至640SP
3、內(nèi)存控制器的精簡,256bit降至128bit
Radeon HD4770的規(guī)格與Radeon HD4830非常接近,不同的是Radeon HD4830所采用的RV770LE 640個SP是由800個SP的RV770PRO屏蔽而來,在晶體管數(shù)量上并沒有降低,而RV740是原生640SP設(shè)計,140平方毫米的核心面積比260平方毫米的RV770降低了46%!

128bit顯存位寬,GDDR5彌補(bǔ)位寬不足:
也許大家會對Radeon HD4770 128bit的顯存位寬感到不解,其實這根本不需要擔(dān)心,Radeon HD4770顯卡采用了GDDR5顯存,頻率上比Radeon HD4830 的GDDR3顯存大幅提升,使兩者顯存帶寬相差無幾,Radeon HD4770顯存帶寬為128bit×3200MHz/8=51.2GB/s,Radeon HD4830的顯存帶寬為256bit×1800MHz/8=57.6GB/s(與9800GT相同),而顯存帶寬對性能的影響遠(yuǎn)遠(yuǎn)小于核心頻率的影響,Radeon HD4770 750MHz的核心頻率比Radeon HD4830的575MHz高出了30%!

從規(guī)格上來看,Radeon HD4770所具備的性能介于Radeon HD4850和Radeon HD4830之間。
AMD Stream和DirectX 10.1
OpenCL統(tǒng)一GPGPU運(yùn)算——AMD Stream
AMD的GPGPU技術(shù),更加傾向于開放式通用計算語言,及OpenCL。由于OpenCL是一種開放性強(qiáng)的API,所以AMD并不會獨享,定期放出的SDK可以讓更多的人利用Radeon HD顯卡,在多種平臺上進(jìn)行GPGPU應(yīng)用和移植,另外在Windows 7中,Direct Compute也是AMD面向GPGPU應(yīng)用的一種重要開發(fā)語言。

AMD在并行計算方面的理解與NVIDIA也有著非常大的差別,AMD同時擁有GPU和CPU,因此在針對并行運(yùn)算的應(yīng)用方面,更加注重CPU、GPU兩者之間的平衡,雖然我們現(xiàn)在還沒有看到過

Cyberlink 公司推出的視頻轉(zhuǎn)碼工具對AMD CPU、GPU提供了非常良好的支持
提升的不僅僅是畫質(zhì),DirectX 10.1游戲
與DirectX 10相比,DirectX 10.1在畫面特效上增加了一些特性,如:全局光照明;陰影濾波、HDR、渲染精度的提升,為游戲的畫面帶來了更加出色的表現(xiàn),但是更重要的是在執(zhí)行效率方面,DirectX 10.1也在DirectX 10的基礎(chǔ)上有了明顯提升。

S.T.A.L.K.E.R Clear SKY DX10.1、DX10性能、畫質(zhì)對比

Stormrise DX10.1、DX10性能、畫質(zhì)對比

H.A.W.X DX10.1、DX10性能對比

UNIGEINE DX10.1、DX10畫質(zhì)對比
GPU和CPU的平衡物理加速——Havok
著名的物理技術(shù)公司Havok雖然于2007年9月被Intel收購,但AMD仍然與其進(jìn)行了深度合作,與NVIDIA不同的是,AMD所采用的Havok物理加速引擎,不但可以利用GPU進(jìn)行運(yùn)算,也可以利用CPU進(jìn)行運(yùn)算,其實以往的Havok的物理游戲已經(jīng)有很多很多,一直都是依靠CPU來實現(xiàn)物理特效的運(yùn)算,而此次AMD GPU的加入,是Havok的工作模式更加廣泛,這樣就能夠根據(jù)CPU、GPU的不同物理運(yùn)算能力,在兩者之間達(dá)到平衡,更加合理的利用PC資源。


AMD GPU實現(xiàn)的Havok物理加速DEMO
使用Havok物理特效的游戲非常非常多,在幾百款游戲和非常多的動畫電影中,我們都能夠找到Havok的身影,雖然CPU能夠在已有的游戲中進(jìn)行高效Havok物理加速,但是我們?nèi)匀黄诖С諫PU加速的Havok游戲能夠早日到來,而不是幾個演示用的DEMO。
性能、功耗硬件測試環(huán)境介紹
雖然對于Radeon HD顯卡來說,AMD平臺能夠更好的對其提供支持,但是為了測試的公平性,我們還是選擇了強(qiáng)大的Core i7平臺。
|
|
|
45nmQuad-Core 2.66GHz L3=8MB |
|
|
625/2000MHz 512MB/256bit |
|
575/1800MHz 512MB/256bit |
|
850/3200MHz 512MB/128bit |
|
600/1500/1800MHz 512MB/256bit |
|
MSI微星X58PRO |
Intel X58+ICH10R |
內(nèi)存 |
Kingston金士頓 HyperX 1GB DDR3 ×2 |
|
|
Wesern tDigital西部數(shù)據(jù) 1TB |
|
|
|
|
|
Samsung三星 SyncMaster 2433BW |
|
參測顯卡我們加入了RV770pro核心的Radeon HD4850和Radeon HD4830,以及與Radeon HD4830同定位的9800GT三款顯卡,與Radeon HD4770的表現(xiàn)進(jìn)行對比。

GPU-z能夠完整識別出Radeon HD4770的規(guī)格

驅(qū)動程序信息
理論性能測試:3DMark Vantage


DirectX 9游戲測試:Left 4 Dead



在第一項游戲測試中,Radeon HD4770的性能沒有與Radeon HD4830拉開明顯的差距,與Radeon HD4850的差距也比較明顯,而面對9800GT,能夠非常輕松的取勝。
DirectX 9游戲測試:F.E.A.R 2



測試中,Radeon HD4770在1600×1200分辨率設(shè)置下的性能在Radeon HD4850、HD4830之間,大幅領(lǐng)先9800GT,在1920×1200分辨率中,三款Radeon HD4800顯卡雖然都下降了20多fps,但仍然能夠與9800GT拉開差距。
DirectX 10游戲測試:Farcry 2



Farcry 2游戲測試中,Radeon HD4770與Radeon HD4850保持在相同水平上,而Radeon HD4830雖然與前兩款顯卡有明顯的差距,但與9800GT相比也有明顯的優(yōu)勢。
DirectX 10游戲測試:Crysis Warhead



Crysis Warhead是一款“The Way It's Meant to be Played”游戲,但是9800GT的表現(xiàn)依然不能超越任何一款參測的Radeon HD4000顯卡,Radeon HD4770的表現(xiàn)在Radeon HD4850與Radeon HD4830之間。
DirectX 10.1游戲測試:H.A.W.X



DirectX 10.1僅被Radeon HD顯卡支持,我們前面提到DirectX 10.1在執(zhí)行效率上的提升是非常明顯的,因此在兩種分辨率設(shè)置下,三款Radeon HD顯卡都大幅超越了9800GT,Radeon HD4770的表現(xiàn)基本與Radeon HD4850保持一致。
核心930MHz!Radeon HD4770超頻測試
雖然Radeon HD4770的默認(rèn)750MHz核心頻率已經(jīng)達(dá)到了較高的水平,但40nm制造工藝使其仍然還有很大的超頻空間,另外3200MHz的默認(rèn)顯存頻率對于GDDR5來說,也非常保守,因此大幅提升Radeon HD4770的頻率并非難事。

用OverDirve超頻至830/3400MHz
在驅(qū)動程序的OverDirve超頻功能中,頻率上限有些保守,因此我們僅能夠?qū)㈩l率調(diào)整至830/3400MHz的最大值,但這并不是Radeon HD4770的真正實力。

超頻至830/3400MHz的3DMark Vantage成績(點擊查看大圖)

修改Rivatuner配置文件超頻Radeon HD4770(點擊查看大圖)
在Rivertuner.cfg文件中加入Radeon HD4770的設(shè)備ID,可以繼續(xù)提升Radeon HD4770的頻率,我們將核心/顯存頻率分別超至了930MHz和4200MHz!相信采用更加出色的散熱方式,核心頻率突破1GHz,一定非常容易。
Radeon HD4770功耗測試


待機(jī)功耗方面,Radeon HD4770與GeForce 9800GT保持在相同水平,1w左右的差距并不明顯。

GPU高負(fù)載時,Radeon HD4770的優(yōu)勢得到了充分的體現(xiàn),整機(jī)功耗比GeForce 9800GT低了14w。

HD4770 PK HD4850:
Radeon HD4770與其他三款顯卡的較量,結(jié)果非常清晰,與Radeon HD4850相比,Radeon HD4770在多數(shù)游戲中略低于Radeon HD4850,并且早個別游戲的表現(xiàn)上能夠與HD4850保持在同一水平線上,相信超頻后的Radeon HD4770超越標(biāo)準(zhǔn)頻率的Radeon HD4850并非難事。
HD4770 PK HD4830:
憑借核心頻率的優(yōu)勢,Radeon HD4770在各項性能測試中,都完全超越了Radeon HD4830,一旦799元售價的4770上市,Radeon HD4830必定被用戶和市場遺棄。
HD4770 PK 9800GT:
毋庸置疑,以往9800GT與Radeon HD4830的對決,9800GT也僅能在小部分PhysX游戲和“The Way”游戲中取得不怎么光彩的勝利,而面對性能更強(qiáng)的Radeon HD4770就更顯得力不從心了。
最強(qiáng)799元顯卡,Radeon HD4830的絕佳接班人:
Radeon HD4770的性能在799元以下的顯卡市場中絕對最具殺傷力,AMD首款桌面平臺40nm顯卡在目前的產(chǎn)品格局中非常成功,無論是性能、功耗、還是成本上,Radeon HD4770都比目前的799元顯卡具備更強(qiáng)的競爭力。當(dāng)Radeon HD4830退市以后,Radeon HD4770可以完美成為Radeon HD4830的接班人。雖然Radeon HD4770已經(jīng)解禁,但是我們在市場上見到這款產(chǎn)品大量上架的時間,還要再等1個月左右,雖然有些遺憾,但仍然值得期待。