英偉達(dá)新顯卡發(fā)布的節(jié)奏非常快,RTX3080還沒(méi)發(fā)布多久,RTX3090就發(fā)布了,而RTX3070也將在下月中旬發(fā)布。
小熊錯(cuò)過(guò)了RTX3080,這次先寫(xiě)RTX3090的評(píng)測(cè)。對(duì)比RTX 3080,RTX 3090的流處理器數(shù)量、Tensor Core、 ROP單元、顯存帶寬、紋理單元都提升了20%左右,TDP也從RTX 3080的320W進(jìn)一步提高到了350W。9月24日上市,售價(jià)11999元,相比RTX3080的價(jià)格也翻了一倍。
▼這次拉來(lái)作對(duì)比的是RTX2080s,完全同步的對(duì)比評(píng)測(cè)。以前玩過(guò)RTX2080Ti,所以也有些數(shù)據(jù),但平臺(tái)和驅(qū)動(dòng)都不同。最大的遺憾是沒(méi)有一手的RTX3080數(shù)據(jù),只能參考現(xiàn)在網(wǎng)上的評(píng)測(cè)數(shù)據(jù)。
RTX2080TI的的流處理器(CUDA)數(shù)量是4352,RTX2080S是3072,而RTX3080則暴增到了8704個(gè),RTX3090更夸張,是10496個(gè),那么RTX3090,3080相對(duì)RTX2080TI的性能提升不應(yīng)該是200%以上嗎?但是并沒(méi)有!原因就是要從SM單元說(shuō)起。
顯卡運(yùn)算處理方式主要有2種,一種是負(fù)責(zé)浮點(diǎn)型運(yùn)算,負(fù)責(zé)比較大小,處理結(jié)果,計(jì)算最大值最小值的數(shù)學(xué)運(yùn)算;另一種是負(fù)責(zé)整數(shù)運(yùn)算,主要負(fù)責(zé)內(nèi)存尋址和獲取資料等工作。但在Turing誕生之前,GPU核心中并沒(méi)有單獨(dú)的FP32和INT32單元,從Kepler到Maxwell到再到Pascal,無(wú)論整數(shù)還是浮點(diǎn)都交給相同的核心進(jìn)行運(yùn)算,顯卡所以核心在一個(gè)周期內(nèi)只能進(jìn)行一種運(yùn)算。
就強(qiáng)度而說(shuō)浮點(diǎn)運(yùn)算是高于整數(shù)運(yùn)算的。經(jīng)過(guò)英偉達(dá)的分析每100條指令操作中有62條是浮點(diǎn)指令操作,38條是整數(shù)指令操作,即浮點(diǎn)(FP32)/整數(shù)(INT32)核心的科學(xué)比例為62:38(也有說(shuō)是64:36的)。
Turing設(shè)計(jì)思路是認(rèn)為之前的運(yùn)算效率太低,造成了大量核心的閑置,于是將負(fù)責(zé)浮點(diǎn)和整數(shù)的核心分開(kāi),每個(gè)SM單元擁有64個(gè)FP32核心,64個(gè)INT32小核心,但由于這些小核心性能比較弱,所以NVDIA并未把這些核心算作CUDA核心。
新一代Ampere(安培)架構(gòu)的RTX30系列顯卡則又統(tǒng)一了INT32與FP32單元,原本只能做整數(shù)運(yùn)算的INT32單元現(xiàn)在既能做整數(shù)運(yùn)算,也能做單精度浮點(diǎn)運(yùn)算,即原來(lái)的FP32并沒(méi)有動(dòng),INT32變成了INT32與FP32的混合核心,并且由小核心變成和FP32一樣的大核心,這樣這些混合核心也被算進(jìn)了CUDA。所以其實(shí)嚴(yán)格意義上說(shuō)Ampere的CUDA數(shù)量提升遠(yuǎn)沒(méi)有官方說(shuō)的那么夸張。
再回到到開(kāi)頭說(shuō)的,那Ampere不是把Turing的改動(dòng)又改回去了?正應(yīng)了那句話(huà),天下大事合久必分,分久必合。當(dāng)然小熊畢竟是門(mén)外漢,也不明白這兩種架構(gòu)哪個(gè)更好,個(gè)人也覺(jué)得大家就不要在意CUDA數(shù)量了,畢竟性能提升才是實(shí)實(shí)在在的。
買(mǎi)不起10900k,只能用OC 5GHz的10700k為大家作測(cè)試了,還請(qǐng)大家諒解!具體配置如下:
CPU:英特爾(intel) i7 10700k OC 5GHz
主板:華擎(ASRock) Z490 Phantom Gaming-ITX/TB3
內(nèi)存:影馳(Galaxy)HOF OC Lab 大師 DDR4 4000 8G*2
顯卡:耕升(GAINWARD)RTX 3090炫光
索泰(ZOTAC) RTX2080super玩家力量至尊PGF OC
SSD:西部數(shù)據(jù) (Western Digital)WD_BLACK SN750 1TB
電源:安鈦克(Antec) HCG 1000 Extreme
機(jī)箱:安鈦克 (Antec) Striker 鋒芒
▼在RTX3090的24G顯存面前,16G的內(nèi)存已經(jīng)抬不起頭了
▼電源采用了額定1000w,保證電力供給充足。
▼由于Striker機(jī)箱的特殊結(jié)構(gòu),使得顯卡被安裝在正面,對(duì)顯卡來(lái)說(shuō)是一個(gè)基本完全開(kāi)放的平臺(tái)。
▼再次抱歉沒(méi)有8K顯示器來(lái)測(cè)試RTX3090,只能使用PD2700U(27寸,4k分辨率)的顯示器!
系統(tǒng):Windows 10 Version 2004 64-bit
驅(qū)動(dòng): 456.38
理論性能分析
▼這款耕升的RTX3090炫光版基本就是公版的性能參數(shù)。
▼在3DMARK firestrike ultra基準(zhǔn)跑分項(xiàng)目中,耕升RTX3090炫光的圖形得分為12561、顯卡測(cè)試1的幀數(shù)為68.25,已經(jīng)非常流暢了;顯卡測(cè)試2幀數(shù)為45.53,算是基本流暢。以DX12為基準(zhǔn)的time spy extreme的圖形得分為10146、顯卡測(cè)試1的幀數(shù)為65.19,顯卡測(cè)試2幀數(shù)為58.91,都很流暢。
▼UNIGINE SUPERPOSITION的8K OPTIMIZED的平均幀數(shù)也到達(dá)了54.22。
▼數(shù)據(jù)直接匯總為表格:以RTX3090為100%計(jì),3DMark Fire Strike(DX11)中 ,RTX2080s的性能為~57%;RTX2080TI為~70%;RTX3080為~86%,3DMark Time Spy(DX12)以及SUPERPOSITION測(cè)試也基本是這個(gè)結(jié)果。
RTX3080的數(shù)據(jù)參考網(wǎng)上評(píng)測(cè)。另外還要說(shuō)明的是使用的RTX2080s以及以前的RTX2080TI都是超高公版的頂級(jí)顯卡,而耕升RTX3090炫光基本為公版性能,所以如果是公版比公版,RTX3090和這兩款顯卡數(shù)據(jù)差距會(huì)更大。
實(shí)際游戲測(cè)試
在實(shí)際游戲測(cè)試中,RTX3080都已經(jīng)可以完美流暢進(jìn)行4K游戲了,那么RTX3080就更不成問(wèn)題了!游戲測(cè)試截圖如下:
▼
▼
▼
▼
▼在吃雞中,無(wú)腦全部超高特效,2k分辨率下幀數(shù)可以在~200fps以上;4k分辨率率下也能在~120以上,即使沒(méi)有8K顯示器,也可以讓4k的144Hz顯示狀態(tài)拉滿(mǎn)!
不過(guò)在測(cè)試中也發(fā)現(xiàn)了一個(gè)問(wèn)題,就是RTX3090在1080p分辨率下表現(xiàn)不佳,很多評(píng)測(cè)認(rèn)為是CPU性能不夠。個(gè)人倒認(rèn)為是功耗墻的限制,因?yàn)閷?shí)測(cè)在1080p分辨率下,顯卡的負(fù)載會(huì)變的非常低,而頻率則會(huì)維持在比較高水平(肯定是沒(méi)碰到溫度墻);到了4k分辨率,顯卡的負(fù)載會(huì)基本拉滿(mǎn),而頻率則會(huì)有所降低,所以小熊分析這是功耗墻限制顯卡的性能,因?yàn)榈头直媛氏氯绻阅苋_(kāi)幀數(shù)會(huì)非常高,將把顯卡的功耗進(jìn)一步拉高,所以驅(qū)動(dòng)不得不降低負(fù)載以便功耗還在限制之內(nèi)。
RTX3090的流處理器相對(duì)于3080多了20%,但是功耗提升只有~10%。所以說(shuō)如果說(shuō)320W的TDP不能完全發(fā)揮RTX3080的性能,那么350W的TDP顯然更不能完全發(fā)揮RTX 3090的性能。
▼分析數(shù)據(jù)匯總成表,由于上面說(shuō)到1080p的問(wèn)題,所以就沒(méi)有統(tǒng)計(jì)1080p的數(shù)據(jù)??梢钥吹絉TX3090在4k分辨率下性能優(yōu)勢(shì)遠(yuǎn)超過(guò)2k分辨率的,因?yàn)榻地?fù)載的問(wèn)題,2k分辨率下的小部分游戲也會(huì)出現(xiàn)這個(gè)問(wèn)題,不過(guò)出現(xiàn)的頻率小,時(shí)間短很,所以最后還是以4k的性能為準(zhǔn)。
▼DX12的游戲中,還是以4k的性能為準(zhǔn),具體數(shù)據(jù)見(jiàn)下表,基本和DX11的趨勢(shì)差不多。
再次強(qiáng)調(diào),使用的RTX2080s以及以前的RTX2080TI都是超高公版的頂級(jí)顯卡,而RTX3080的數(shù)據(jù)來(lái)自網(wǎng)上評(píng)測(cè),這部分?jǐn)?shù)據(jù)只能等到小熊實(shí)測(cè)過(guò)3080才能進(jìn)一步修正了。
光線(xiàn)追蹤以及DLSS表現(xiàn)
安培構(gòu)架采用了第二代RT Core使得光追性能得到了翻倍提升,以及第三代Tensor Core(負(fù)責(zé)DLSS),效率是第二代的4倍,當(dāng)然由于安培構(gòu)架將每個(gè)SM中的Tensor Core減半,所以實(shí)際上它能達(dá)到圖靈2倍的效能。
光線(xiàn)追蹤技術(shù),即利用算法來(lái)模擬真實(shí)世界中的光線(xiàn)的物理特點(diǎn),能夠做到物理上精確的陰影、反射和折射以及全局光照,在虛擬的游戲場(chǎng)景下,讓游戲中的物體更加具有真實(shí)感。有種身臨其境的感覺(jué)。
▼如《飛向月球》開(kāi)了光追,才能從玻璃中看到鏡像,另外環(huán)境中的陰影表現(xiàn)有更加豐富和真實(shí)了。
▼地鐵:離去中選擇最猛的EXTREME預(yù)設(shè)以及ULTRA的光追特效也可以到達(dá)流暢的~60 fps,當(dāng)然也得開(kāi)DLSS。
▼德軍總部-新血脈對(duì)顯卡的要求比較低,開(kāi)dlss的4k幀數(shù)也可以過(guò)百。
DLSS的全稱(chēng)為Deep Learning Super Sampling,翻譯過(guò)來(lái)就是深度學(xué)習(xí)超級(jí)采樣。其本質(zhì)是用更低分辨率的圖像來(lái)代替部分高分辨率的圖像,從而減小運(yùn)算量提高幀數(shù),不過(guò)由于深度學(xué)習(xí),即AI的銳化補(bǔ)償技術(shù),代替的非常巧妙,畫(huà)面還能保持高分辨率下的清晰程度。
▼還是做個(gè)表格來(lái)統(tǒng)計(jì)下吧,占用資源%就是開(kāi)啟特效后幀數(shù)下降的百分比?,F(xiàn)有條件只能和RTX2080s比一下了??梢钥吹郊词筊TX3090不開(kāi)DLSS,幀數(shù)下降的比例也要比2080s少很多,而開(kāi)啟DLSS后的幀數(shù)提高幅度也要比2080s高一些。RTX30在光線(xiàn)追蹤以及DLSS表現(xiàn)確實(shí)要好于RTX20。
理論計(jì)算能力
▼實(shí)測(cè)RTX3080的單精度浮點(diǎn)運(yùn)算性能是34587GFLOPS,RTX2080S的單精度浮點(diǎn)運(yùn)算性能是12126GFLOPS,提升的幅度已經(jīng)快接近3倍了!
功耗和溫度
▼測(cè)試時(shí)的環(huán)境溫度為~25度。
▼首先使用使用Furmark來(lái)對(duì)進(jìn)行烤機(jī)測(cè)試,參數(shù)設(shè)定為1920*1080分辨率、0AA,發(fā)現(xiàn)頻率居然減少到了1125MHz,明顯碰到了功耗墻,可以看到GPU-Z顯示的功耗為350w。0AA下Furmark的幀數(shù)會(huì)非常高,所以不減低負(fù)載,只能減低頻率以便不超越功耗墻。而前面說(shuō)的1080p游戲測(cè)試則是維持頻率,負(fù)載減少。總之都是功耗限制太死的原因。
▼運(yùn)行10分鐘之后, RTX 3090的溫度穩(wěn)定在72度附近,小米智能插座顯示的輸入功耗為為~470w。
▼在使用time spy的壓力測(cè)試,這個(gè)測(cè)試幀數(shù)肯定高不了,所以可以看到頻率可以維持在1700MHz左右,不過(guò)浮動(dòng)變化還是比較大,GPU-Z檢測(cè)到最大頻率到了1995MHz。完成壓力測(cè)試后的最高溫度為75度,炫光的散熱系統(tǒng)還是不錯(cuò)的。此時(shí)小米智能插座顯示的輸入功耗為為~485w,比之前的Furmark要高了一點(diǎn)。
超頻?別想了!
▼耕升的GW-SOUL軟件,提供簡(jiǎn)單超頻設(shè)定功能,RGB燈效控制以及風(fēng)扇調(diào)速等多種功能。使用該軟件的一鍵超頻功能,在GPU-Z上確實(shí)能有~50MHz左右的提升,實(shí)際測(cè)試3DMARK的最高頻率也從1995MHz到了2040MHz,但分?jǐn)?shù)方面卻沒(méi)有實(shí)際的提升,小熊認(rèn)為就是功耗的管理機(jī)制,這里就不再?gòu)?fù)述了。
顯卡
▼耕升GeForceRTX3080炫光的包裝風(fēng)格科技味十足,并且正面還標(biāo)注了3年質(zhì)保+個(gè)人送保的服務(wù);附件包括RGB顯卡支架,可安裝在顯卡背面的風(fēng)扇,和一條顯卡連接主板同步燈效的RGB連接線(xiàn)。
▼耕升RTX3080炫光的三圍尺寸為329*136*63mm,采用了3個(gè)90mm風(fēng)扇,風(fēng)扇面有圓形和方向的圖案,感覺(jué)充滿(mǎn)幾何圖形的元素。
▼中間是圓形的扇框,風(fēng)扇為十一片扇葉設(shè)計(jì),扇葉采用鋒刃設(shè)計(jì)。
▼兩邊的是棱形導(dǎo)風(fēng)罩。
▼RTX3080炫光還是雙槽固定,不過(guò)厚度達(dá)到63mm,基本上到達(dá)了三槽厚度。側(cè)面有標(biāo)志性GEFORCE RTX的LOGO,旁邊還有耕升GAINWARD的標(biāo)識(shí),并且?guī)в蠷GB燈。配備了雙8PIN外接供電,和公版一致。
▼前端可以看到5根6mm鍍鎳熱管,但其實(shí)有7根,等會(huì)在拆解部分會(huì)看到它的全貌。導(dǎo)風(fēng)罩的前部,附帶了兩個(gè)接口,5PIN接口是通過(guò)線(xiàn)材連接主板實(shí)現(xiàn)RGB同步功能,而4PIN口則是用于連接背板風(fēng)扇。
▼IO部分,擁有3個(gè)DP1.4a規(guī)格接口和1個(gè)HDMI2.1規(guī)格接口,可以支持8K&60Hz的輸出。
▼金屬背板的前部和后部都進(jìn)行了鏤空處理,尤其是前部,因?yàn)檫@部分并沒(méi)有PCB,這樣設(shè)計(jì)可以更輕松吹透鰭片散熱部分。
▼SLI僅限RTX 3090獨(dú)享,玩雙卡的成本進(jìn)一步增大了。
▼附件中的背板風(fēng)扇,直徑80mm。
▼風(fēng)扇安裝在背板上,可以增加散熱系統(tǒng)的空氣流動(dòng)性,更輕松的輕松吹透鰭片。
▼但安裝風(fēng)扇也會(huì)使得顯卡的厚度增加,一些機(jī)箱可能會(huì)安裝不了,比如小熊測(cè)試用的Striker。
▼小熊是不會(huì)放棄拆解卡皇的機(jī)會(huì)!和RTX3080最大的不同就是PCB背面還有12顆顯存,單顆容量1GB,再加上正面的12顆,正好24顆,24GB。
▼所有散熱器部分貼近電感、顯存芯片、MOS管芯片的地方都配置了導(dǎo)熱墊。
▼除了前端看到的5根貫通的熱管,還有2根在核心區(qū)域成U型,從后端穿出,組成了7條6mm鍍鎳熱管+回流焊的散熱系統(tǒng)。
▼顯卡PCB的VRM供電使用獨(dú)立加厚散熱板設(shè)計(jì),另外也可以看到顯卡的整個(gè)PCB長(zhǎng)度只有215mm,不過(guò)還是采用了12層PCB板,進(jìn)一步提升顯卡的電氣性能。
▼GPU核心為NVIDIA的GA102-200 ,8nm工藝制程。;顯存是美光的GDDR6X;供電方案和采用了18相供電:9相NVVDD核心供電,5相MSVDD核心供電,4相顯存供電。Dr mos的具體型號(hào)為Alpha & Omega的ALN0 0N18。PWM部分使用了3顆uP9511R,正面有1顆,2顆在PCB背面。
內(nèi)存
▼為了不給測(cè)試平臺(tái)拖后腿,選擇了高頻內(nèi)存:HOF OC Lab 大師 DDR4 4000 8G*2。
▼表面經(jīng)過(guò)特殊涂層處理的純白金屬馬甲,手感非常好。內(nèi)存使用了三星的B-die芯片和10層的加強(qiáng)型PCB,XMP頻率4000MHz,時(shí)序19-25-25-45,電壓1.4V。
▼不過(guò)大師系列是無(wú)RGB燈效的,當(dāng)然白色的馬甲,非常容易映射周?chē)墓庑А?/span>
電源
High Current Gamer Extreme,簡(jiǎn)稱(chēng) HCGX,包裝的配色是玫瑰金,該系列通過(guò)80 PLUS金牌認(rèn)證,并提供了10年質(zhì)保,使用了額定1000w的型號(hào)。
▼開(kāi)盒后可以看到除了說(shuō)明書(shū)之外,在理線(xiàn)方面分別提供扎帶和理線(xiàn)帶。
▼1000w型號(hào)的長(zhǎng)度為16cm,而850w型號(hào)的長(zhǎng)度是14cm,對(duì)機(jī)箱的兼容性會(huì)更好些;兩側(cè)都為玫瑰金色的金屬板,有品牌 LOGO和型號(hào);在電源輸入口旁邊還有一個(gè)按鍵,就是Hybrid模式切換功能的開(kāi)關(guān),開(kāi)啟后電源風(fēng)扇會(huì)在低負(fù)載時(shí)停轉(zhuǎn),提供更好的靜音表現(xiàn)。
▼全模組輸出接口,提供了8個(gè)12V的CPU/PCle接口,而且并不區(qū)分CPU/PCle,可以隨意使用。
▼HCGX電源采用了單路12V設(shè)計(jì),單路12V輸出達(dá)到了83A,即996W,還是偏向游戲應(yīng)用的設(shè)計(jì)。
上面通過(guò)GW-SOUL軟件可以看到炫光支持支持5種燈光效果,同時(shí)還有一鍵切換主板同步模式(需要連線(xiàn)),不過(guò)并不支持彩虹跑馬燈的模式。
▼
▼中間的風(fēng)扇帶燈珠,而兩邊的是風(fēng)扇框有光。
▼
▼品牌logo燈。
RTX3090可能比RTX3080高~15%,理論上限也只有20%,但價(jià)格翻倍了。其實(shí)想想之前RTX2080s和2080ti的性能和價(jià)格,也就不會(huì)太奇怪現(xiàn)在RTX3090的定價(jià),畢竟這種定位的顯卡就不要去討論性?xún)r(jià)比了。
耕升RTX 3090炫光這款顯卡的顏值和散熱系統(tǒng)還是不錯(cuò)的,當(dāng)然現(xiàn)在的問(wèn)題不是買(mǎi)哪個(gè)牌子型號(hào),而是怎么才能買(mǎi)到!
確實(shí)4k分辨率下大多數(shù)游戲不會(huì)使用超過(guò)10GB以上的顯存,所以RTX3090的優(yōu)勢(shì)還是在8K分辨率上。但由于沒(méi)有設(shè)備 ,沒(méi)發(fā)作8k分辨率的測(cè)試,由于時(shí)間關(guān)系也沒(méi)有使用DSR來(lái)進(jìn)行模擬測(cè)試。其實(shí)就像曾經(jīng)的RTX2080以及RTX2080Ti在4k分辨率下表現(xiàn)的還不夠完美一樣,現(xiàn)在的RTX3090在8k分辨率上表現(xiàn)也不會(huì)非常完善,畢竟還要借助DLSS,但很多游戲是不支持的。所以RTX3090適合高玩?zhèn)兊膰L鮮,畢竟8k是屬于未來(lái)的!
另一方面24GB顯存也是一些渲染以及視頻創(chuàng)作者的需求。如果說(shuō)你就是想用RTX3090在4k分辨率的顯示器上玩游戲,那么它可以提供更好的光追性能,或者跑滿(mǎn)您的高刷新率顯示器。
一個(gè)困惑:為啥英偉達(dá)把功耗限制的那么死,限制了RTX3080和3090的進(jìn)一步發(fā)揮。小熊想到的幾個(gè)原因和大家一起分享和探討:
1)CUDA過(guò)多,高負(fù)載高頻率難以控制,限制功耗墻可以使顯卡更穩(wěn)定運(yùn)行,減少返修率。
2)制式升級(jí)到了8nm,但功耗還是比上代顯卡高了接近100w,再高了不太好看,會(huì)被說(shuō)成電老虎,不利于宣傳。
3)畢竟競(jìng)爭(zhēng)對(duì)手還沒(méi)出牌,而且現(xiàn)在的性能提升對(duì)于RTX20已足夠,如果AMD的顯卡性能優(yōu)秀,可以再進(jìn)一部分調(diào)整驅(qū)動(dòng)釋放性能,或者再推出功耗更高,性能更強(qiáng)的3080s、3090s來(lái)反制對(duì)手。
RTX30的到來(lái)肯定會(huì)使電源廠(chǎng)家高興,高功率的電源好賣(mài)了!官方推薦RTX3080和3090最好使用額定750w的電源,經(jīng)小熊實(shí)測(cè)后,顯卡烤機(jī)功率在480w~490w左右,游戲時(shí)測(cè)試的功耗在~530w左右(游戲時(shí)CPU的負(fù)載會(huì)再高一些),當(dāng)然余量還是要留好的,顯卡的峰值用電也要考慮到,所以如果是10700k或者10900k最好還是老老實(shí)實(shí)按官方的750w,甚至850w來(lái)選電源;如果是10400,10500以及同級(jí)別的AMD CPU,選650w的電源也可以。
另一個(gè)高興的可能是分體水冷廠(chǎng)家了,這么高的功耗不想嘗試一下水冷的效果嗎?小熊這個(gè)測(cè)試平臺(tái)其實(shí)很方便連接顯卡水冷,只是現(xiàn)在還沒(méi)有冷頭,等以后有機(jī)會(huì)在測(cè)試下RT30在水冷下的表現(xiàn)。
購(gòu)買(mǎi)鏈接:
上一篇
玩王者、吃雞總被虐?來(lái)試試萊仕達(dá)K30手游鍵盤(pán)吧
下一篇
進(jìn)化 不止性能! iGame GeFore RTX 3080 Advance 首測(cè)報(bào)告