大家好,我是黃昏百分百,很榮幸獲得了英偉達與七彩虹的聯(lián)合邀請,參與到RTX 4090顯卡的媒體首測中來,我拿到的是七彩虹iGame GeForce RTX 4090 Neptune OC顯卡,也就是我們俗稱的水神顯卡。
今天便與各位實際測試一下,這款全新次代的英偉達旗艦顯卡,到底有著多么巨大的架構與性能進步。廢話不再多說,我們開車吧。
▲NVIDIA Ada Lovelace 架構作為 GeForce RTX 40 系列顯卡的核心,必須要放在最前面說。Ada 架構基于定制的 TSMC 4N 5nm 工藝,晶體管數(shù)量從上一代的 280 億個激增至 760 億個,是目前世界上工藝最精湛的 GPU 架構。
▲從圖靈架構開始,英偉達開始采用 流式多處理器 (Streaming Multiprocessor,SM)架構以執(zhí)行光線追蹤等運算工作,上圖左側為全新Ada架構,右側為30系所使用的安培架構,從圖中可以看出,SM布局基本與上代保持一致,而最核心的變化便是其內Ada 4代 Tensor Core取代了安培架構中的3代的Tensor,用于光線追蹤的RT CORE從安培架構的第二代RT CORE升級到了第三代RT CORE。不僅將光線與三角形求交性能提高了一倍,還將 RT-TFLOP 峰值性能提高了一倍之多。
▲而每兩個SM組成一個紋理處理集群(Texture Processing Clusters,TPCs),再由多個TPC組成一個圖形處理集群(Graphics Processing Clusters,GPCs)。
▲而Ada架構的GPU則是由多個GPC組成的,以一個完整的AD 102芯片為例,其擁有12個GPC,72個TPC,144個SM,18432個 CUDA核心。
▲而目前的RTX 4090的GPU芯片中,則擁有128個SM,16384個CUDA核心??梢夾da架構的GPU未來還有進一步提升性能參數(shù)的空間。
▲得益于Ada架構的巨大進步,RTX 4090的算力相較于RTX 3090 Ti也有著翻倍的提升,由RTX 3090 Ti的 40 TFLOPS提升至83 TFLOPS,這是一個什么概念呢?在2003年上映的電影《終結者3》中,毀滅人類的天網(wǎng)超級計算機算力為60 TFLOPS,而現(xiàn)在大家手上的一塊顯卡的性能便超過了天網(wǎng),讓人驚嘆這些年來科技進步之快,當年的科學幻想一個又一個成為現(xiàn)實。
▲技術方面,ADA架構的RTX顯卡還帶來了著色器執(zhí)行重排序、微網(wǎng)格位移、不透明微遮蔽、FP8推理、光流加速器、DLSS 3。這幾個技術,我會在后面詳細介紹。
▲最后,在能效比方面,Ada 架構的效率也令人感到不可思議:在相同的功率下,其性能相較安培架構最高可達兩倍以上;增大功率,性能還能持續(xù)提升。
這里先說一下著色器執(zhí)行重排序 (SER) 技術吧。
▲高級光線追蹤技術需要計算同一場景中數(shù)百萬條光線照射在諸多不同類型材質上的效果,這就使得著色器只能低效地處理一系列截然不同的工作負載。(在渲染 3D 場景時,著色器用于計算恰當?shù)牧炼取刀群皖伾墑e。每一款現(xiàn)代游戲都需要使用到著色器。)
著色器執(zhí)行重排序 (SER) 技術能夠動態(tài)調整這些工作負載的順序,讓原本低效的流程變得異常高效。SER 可將光線追蹤操作的著色器性能最高提升 2 倍,或將游戲的幀率最高提升 25%。
▲通俗一點說,SER技術便是通過將排序,使顯卡由逐個運算加法改為了運算乘法,自然效率能夠得到大幅提升,同時不會增加顯示延遲。
▲緊接著我們再說一下第三代RT CORE新搭載的兩款引擎,除了在安培架構中已經使用的Box Intersection Engine與Triangle Intersection Engine兩款引擎。Ada架構搭載的新款 RT CORE 還配備全新 Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎。
▲OMM 引擎可大幅提升對 alpha 測試紋理進行光線追蹤的速度,此類紋理通常應用于樹葉、顆粒,圍欄等。
▲以樹葉為例,全新ADA架構RT Core搭載的OMM引擎可將樹葉分為全透明部分,不透明部分與半透明部分,大幅減少著色器工作量,進而明顯降低光線追蹤對游戲性能的影響。
▲左側為未開啟OMM引擎時的著色器工作量,右側為OMM引擎開啟后的著色器工作量,可見OMM的性能立竿見影。
▲而面對珊瑚蟹這種極不規(guī)則,超多個平面(三角形)的物體,則需要DMM引擎來提升光追性能了。
▲相較于安培架構需要將多個三角形與復雜的BVH放入RT CORE中進行處理,ADA機構可以將圖形轉化為一個基礎的三角形,一個Displace Map與一個簡單的BVH,再放入RT CORE中進行處理。
▲因此,DMM 引擎能夠以近乎 9 倍的速度構建光線追蹤邊界體積層次結構 (BVH),而所占用的顯存只有之前的二十分之一。從而實現(xiàn)幾何復雜場景的實時光線追蹤。
有一說一,光線追蹤還是會對游戲幀數(shù)有一定的負面影響的,所以就需要DLSS來提升游戲幀數(shù)了,DLSS的全名是DEEP LEARNING SUPER SAMPLING(深度學習超級采樣),是一種通過基于 AI 的超高分辨率重新定義實時渲染,即渲染更少的像素,然后使用 AI 構建更清晰、更高分辨率的圖像的方法,可以有效的在不犧牲畫質的情況下通過AI算法提升游戲的幀率表現(xiàn)。
▲從圖靈架構的RTX 20系顯卡開始,DLSS技術隨著顯卡架構一起進化,目前已經進化到了第三代DLSS,除了代表性的DLSS 超分辨率技術,還融合了DLSS幀生成技術與NVIDIA Reflex技術。
▲這里重點說一下DLSS 3中的潛在幀生成技術,其可通過對前后幀的分析,在兩幀之間插入一幀,進而是游戲幀數(shù)有著近乎翻倍的提升??隙ㄓ信笥褧?,這個插幀技術與電視常用的MEMC插幀技術相比有什么區(qū)別。
▲這里便要說,電視因為其不參與畫面渲染的過程,所以只能夠通過算法與預測中間幀應該顯示的畫面,難免在陰影方面出現(xiàn)不準確的情況,導致插幀后畫面不自然。而英偉達顯卡的DLSS 潛在幀生成技術因為是在渲染過程中在光流加速器中發(fā)生的,所以可以獲得準確的運動矢量(MOTION VECTORS),所以可以準確預測出中間畫面所處的狀態(tài), 自然畫面陰影效果就十分準確了。同時,生成的幀不需要CPU提供數(shù)據(jù),因此整體幀率可以超過CPU渲染的幀率限制,大幅降低了對CPU性能的要求。
▲同時,DLSS 3 潛在幀生成技術與超分辨率技術結合,渲染1080P分辨率的原始畫面,再超分辨率到4K畫面,同時,2個4K分辨率的幀之間再生成一幀。所以,平均兩個4K幀中,只有一張1080P的幀是CPU與顯卡實際渲染的,占總生成畫面的八分之一,可見DLSS技術對幀數(shù)提升之大。
我們來比較一下DLSS開啟后對畫面效果的影響,左側為DLSS性能模式下的4K分辨率,右側為原生4K畫質:
▲首先看一看《賽博朋克2077》BenchMark中的截圖,整體畫面一眼看上去基本無差異,DLSS似乎能夠無比接近原生分辨率了。
▲背景中的這個欄桿,DLSS畫面還要比原生4K畫質更加銳利清晰。
▲不過,背景的瓷磚上,開啟DLSS后還是稍微有一點糊的,不過如果不像我這樣放大多倍去找茬,是根本發(fā)現(xiàn)不了的。
▲在同BenchMark的酒吧場景中,DLSS開啟后,畫面效果則要明顯比未開啟DLSS時更加的透徹,頂部招牌也更加的銳利清晰,個人覺得本場景下DLSS的畫質要明顯優(yōu)于原生4K分辨率。
▲同樣,在網(wǎng)易大作逆水寒的測試中,DLSS開啟后的地磚,相較原生4K分辨率的地磚,紋理上也更加清晰,可見在有光照充足的畫面中,開啟DLSS后的畫面甚至可能超過原生4K分辨率的畫質,且其能偶帶來大幅度的幀數(shù)上升,還是很值得開啟的。
NVIDIA REFLEX 低延遲技術主要分為NVIDIA REFLEX SDK與NVIDIA Reflex延遲分析器,其中NVIDIA Reflex延遲分析器涉及到了外設、顯示器等其它硬件,本文不做涉及,近介紹一下NVIDIA REFLEX SDK。
▲在傳統(tǒng)的圖像處理流程中,如果CPU 處理幀的速度快于 GPU 渲染幀的速度(高U低顯),則會在CPU到GPU之間有一個等待渲染幀的隊列,進而導致渲染延遲的增加。
▲而通過將NVIDIA REFLEX SDK直接集成到游戲中,就可以使CPU的幀處理速度與GPU的渲染速度保持同步,大幅降低渲染隊列,并降低CPU背壓,進而使游戲能夠采樣鍵鼠等外設最新的輸入。最終降低畫面與輸入延遲,提高游戲體驗。目前,NVIDIA REFLEX技術已經被集成在了DLSS 3中。
▲目前已經有超過35款游戲與軟件支持DLSS 3,包括國產游戲《黑神話:悟空》、《光明記憶》、《生死輪回》、《仙劍奇?zhèn)b傳 7》等。
▲有非常多的經典游戲,無論在劇情上還是游戲性上,都堪稱經典,唯獨游戲畫面上受開發(fā)時間限制,已經跟不上現(xiàn)在的潮流。因此,英偉達開發(fā)了RTX REMIX軟件,可以幫助MOD愛好者在AI的幫助下,對游戲畫面進行光追化重構,讓游戲重獲新生。
▲NVIDIA RTX REMIX可以將素材資源整合給多個軟件使用,進而大幅降低MOD制作難度,提高制作效率。
▲V社經典游戲《傳送門》最近便推出了RTX版的DLC,也即將上線,之前在Steam上擁有《傳送門》原作的同學可以免費獲得光追升級哦,游戲的畫面效果可以說是立竿見影,算是老游戲重獲新生的優(yōu)秀例子了。各位MOD愛好者們也可以根據(jù)自己的喜好對舊游戲進行畫質升級,我很好奇各位會拿NVIDIA RTX REMIX去升級哪些游戲的畫質。
▲七彩虹iGame GeForce RTX 4090 Neptune OC的包裝巨大無比,中心處有著顯卡的圖片,周邊則是水流漩渦的紋路,動感十足。右下角則注明了其型號為GeForce RTX 4090,左下角也標注了其搭載了24GB的超大GDDR6X顯存,使其即可成為超強8K游戲顯卡,亦可作為生產力工具使用。
▲iGame Neptune系列顯卡從30系的黑色變?yōu)榘咨琲Game Neptune的標志性特征由圓環(huán)形的海洋之眼進化成為了雙波浪曲線,iGame產品設計師以水流為靈感所特別設計,遵循著水流的運動節(jié)奏打造全新的視覺語言。全新的雙曲線為玩家?guī)韽淖笾劣邑灤┑腞GB視覺盛宴,光效將如水流一般靜謐流淌,潺潺流動,模擬水的流動方向將曾經輝煌的亞特蘭蒂斯文明時代還原得淋漓盡致,為玩家獻上極具藝術氣息的光影盛宴。水冷排方面也由240mm水冷排升級為360mm水冷排,進而提供更強的散熱性能,為硬核的游戲玩家及內容創(chuàng)作者保駕護航,及時消除高負載場景下所產生的核心熱源。
▲全新的iGame Neptune 顯卡的冷頭支持旋轉,是裝機更加便捷,顯卡的安裝位子也可以變得更加靈活。
▲接口方面,七彩虹iGame GeForce RTX 4090 Neptune OC提供的依舊是三個DP 1.4a接口與一個HDMI 2.1接口,七彩虹iGame系列一脈相承的一鍵超頻按鈕依舊得到了保留。玩家輕輕點壓即可進一步獲得更優(yōu)的使用體驗。
▲顯卡金屬裝甲正面擁有一個iGame LOGO,讓正面顯得不單調,內部則藏有全覆蓋的大尺寸銅底,直觸GPU熱源,利于傳遞熱量。因為顯卡本體與風扇分離,所以顯卡尺寸更小更薄,豎裝也非常不錯。
▲我這里用的是追風者的白色PCIe 4.0顯卡延長線幫助顯卡豎裝,顯卡頂部擁有兩個燈,透過玻璃隱約能夠看到iGame的英文與圖形LOGO,燈光亮起來的時候會很漂亮,信仰無處不在。
▲供電方面,英偉達在RTX 3090 Ti時便正式改為了PCIe5.0標準的12+4 Pin接口,七彩虹iGame GeForce RTX 4090 Neptune OC自然采用的也是PCIe5.0標準的12+4 Pin接口,為顯卡的性能釋放提供了可靠的保障。
▲七彩虹iGame GeForce RTX 4090 Neptune OC的合金外甲背板更顯質感,支架為GPU及PCB平均壓力。
▲采用360冷排的冰海散熱器擁有3個120mm靜音風扇,中間的一個印有iGame圖形LOGO,左右兩個則印有iGame英文LOGO,也是信仰滿滿。
▲冷排上擁有著風扇集線器,方便玩家自由更換風扇。
正所謂水火無情人有情,在本次測評中,我將使用上代安培架構的巔峰顯卡七彩虹 iGame GeForce RTX 3090 Ti Vulcan OC,也就是大名鼎鼎的火神顯卡,與本代Ada架構的巔峰顯卡之一,七彩虹 iGame GeForce RTX 4090 Neptune OC,也就是與火神相對的水神顯卡進行對比測試,下面我將放上二者的參數(shù)對比。
▲可以看到,iGame GeForce RTX 4090 Neptune OC 相較于iGame GeForce RTX 3090 Ti Vulcan OC,除了芯片制程之外,最大的提升便是CUDA數(shù)量與核心頻率,其中CUDA數(shù)量由RTX 3090 Ti的10752提升到了16384,增加了5632(52.4%)。
而頻率方面的提升同樣明顯,基礎核心頻率由1560MHz提升到了2520MHz,提升了幾乎1GHz,一鍵超頻核心頻率也由1920MHz提升到了2640MHz。
因此,其性能的提升可以說是十分值得期待的。
▲首先我們來進行8K分辨率下的游戲測試,因為黃昏我家境貧寒,實在沒有物理分辨率8K的顯示設備,所以8K游戲性能方面只能夠使用3D Mark DLSS test來進行測試,其測試原理為連續(xù)進行兩次的3D Mark Port Royal 光線追蹤 基準測試,第一次為關閉DLSS功能,第二次為開啟DLSS功能,通過游戲幀數(shù)變化來測試DLSS功能對游戲性能的提升。
▲首先有一說一,在8K分辨率,DLSS關閉的情況下,無論是RTX 3090 Ti還是 iGame GeForce RTX 4090 Neptune OC,畫面都只能說比PPT流暢一些,分別為8.34 FPS與13.47 FPS。
RTX 3090 Ti只支持DLSS 1與DLSS 2,在開啟DLSS 2時,幀率達到了37.36 FPS,已經算比較流暢了.
而iGame GeForce RTX 4090 Neptune OC 的幀率提升則更加明顯,開啟DLSS 2時幀率便達到了62.6 FPS,可以跑滿HDMI 2.1接口的帶寬了。而開啟DLSS 3之后,幀率更是達到了94.97 FPS,要知道,3D Mark Port Royal的光線追蹤可以說是達到了變態(tài)級別,很多游戲開啟最高光追后,幀率依舊比3D Mark Port Royal的得分高很多,Port Royal得分94.97 FPS,實際游戲中甚至有可能跑滿目前最頂級電視的8K 120Hz,試想下8K、光線追蹤、高幀率三者兼得,是多么爽快的游戲體驗??!
▲而在4K 分辨率下,兩塊顯卡都表現(xiàn)的更好,DLSS關閉的情況下,RTX 3090 Ti的幀率為31.42 FPS,而開啟DLSS 2后, RTX 3090 Ti的幀率提升到了82.28 FPS。
而iGame GeForce RTX 4090 Neptune OC在未開啟DLSS時,幀率便達到了59.72 FPS,可以跑滿常見4K顯示器的60Hz刷新率,而開啟DLSS 2與DLSS 3之后,分辨率分別提升到了142.14 FPS與176.73 FPS。
這兩個幀率意味著什么呢?意味著其可以跑滿目前高端4K電競顯示器 144Hz的基礎頻率與160Hz的超頻后頻率,顯卡的顯示能力,終于能滿足目前最強的顯示器的需求了。
8K分辨率測試比較難辦,4K分辨率就輕松多了,我們首先通過3D Mark進行測試。
▲Fire Strike 是一項適用于高性能游戲電腦和超頻系統(tǒng)的 DirectX 11 基準測試。即使對于最新的顯卡而言,F(xiàn)ire Strike 測試也非常嚴苛,而Fire Strike Ultra是其4K版本。
▲iGame GeForce RTX 4090 Neptune OC的3D Mark Fire Strike Ultra總得分與顯卡得分分別為25248,25626,相較于RTX 3090 Ti的得分14311與13966分別提升了73.4%與83.5。
▲3D MARK專為DirectX 12設計的Time Spy Extreme, Time Spy是一個DirectX 12 基準測試,支持原生新的API 功能,如異步計算,顯式多顯卡適配器技術和多線程,而其Extreme版本則是將分辨率提升至4K。
▲iGame GeForce RTX 4090 Neptune OC的3D Mark Time Spy Extreme總得分與顯卡得分分別為17092,20017,相較于RTX 3090 Ti的得分10784與11107分別提升了58.5%與80.2%。
通過3D Mark的測試,我們基本得知了,在4K分辨率下,iGame GeForce RTX 4090 Neptune OC的游戲性能基本上可達到RTX 3090 Ti的160%-180%,而兩者同時開啟DLSS后,iGame GeForce RTX 4090 Neptune OC的游戲性能更是比RTX 3090 Ti高出一倍還多。
當然,只使用3D Mark進行測試,肯定還是不夠客觀的,那么我便多使用幾塊游戲進行測試吧。
▲我們首先拿7月1日推出的F1? 22為例,它支持NVIDIA DLSS和光線追蹤不透明反射、光線追蹤透明反射、光線追蹤環(huán)境光遮蔽和光線追蹤陰影幾項技術,目前內測版本已經支持DLSS 3并內置了Benchmark, 相信不久的將來,正式版游戲也會更新對DLSS 3的支持。
▲在測試的過程中,我們將使用NVIDIA最新推出的游戲性能監(jiān)測軟件FrameView來進行測試,其可以實時記錄游戲中的幀率、1% Low幀率與延遲等參數(shù),并匯總生成CSV數(shù)據(jù)庫,簡單來說,F(xiàn)rameView可以使沒有內置Benchmark的游戲也能有擁有更客觀準確的性能測試方法。
這里我再補充一下為什么1% Low幀率十分重要,試想一下:
在玩PUBG的時候,你通過十幾分鐘的搜刮,神裝全部到手,但是與人對槍的時候卡了一下,直接被爆頭成盒了,這種搜刮十分鐘,成盒一秒鐘的經歷是什么感受。游戲中往往最激烈對抗時的幀數(shù),才是決定游戲成敗的核心要素,因此,1% Low時的幀率可能要比那99%不激烈對抗時的幀率還要重要!
▲當然,F(xiàn)1 22是擁有BenchMark的,所以我們只使用FrameView補充測量了1% Low的數(shù)據(jù),游戲測試畫面為4K分辨率,光追效果全開。
在BenchMark測試中,RTX 3090 Ti在未開啟DLSS時平均幀率僅為60 FPS,且1% Low 幀率僅為45 FPS,說真的,這對F1賽車這種激烈競技游戲來說還是不夠看的。
而開啟DLSS 2之后,RTX 3090 Ti的平均幀率達到了142 FPS,1% Low 幀率也達到了101 FPS,已經很流暢了。
iGame GeForce RTX 4090 Neptune OC在未開啟DLSS時,平均幀率便已經有95 FPS了,且 1% Low 幀率也有69 FPS。
僅開啟DLSS 2.0時,RTX 4090的平均幀率達到了194 FPS,且 1% Low 幀率也有123 FPS。
而當iGame GeForce RTX 4090 Neptune OC開啟DLSS 3專有的Frame Generation 幀生成功能時,平均幀率達到了可怕的 236 FPS,且 1% Low 幀率也有183 FPS。
平均幀率236 FPS,1% Low幀率183 FPS是什么概念呢?簡單來說,就是目前最強的4K 160Hz的電競顯示器,居然連RTX 4090的1% Low幀率都無法完全顯示出來,顯示器廠商們是時候加把勁,研發(fā)并推出4K 240Hz的高端電競顯示器了!
最后,iGame GeForce RTX 4090 Neptune OC 開啟DLSS 3時的平均幀率與1 % Low幀率,分別是RTX 3090 Ti的166%與181%!
▲緊接著我們測試《賽博朋克2077》,這款大作的媒體體驗版也已經支持DLSS 3了,我們一起去體驗光追效果出眾的夜之城魅力吧。
▲沒錯,又是媒體體驗版,我的Steam賬號里可有著不少好東西呢,最下面那款《瘟疫傳說:安魂曲》(A Plague Tale: Requiem),也將于10月18日發(fā)布,支持DLSS 3,我玩了很好玩,大家也可以期待下哦,同時大家不要急,說完賽博朋克,我就說這款游戲。
▲在實際測試中,RTX 3090 Ti在未開啟DLSS時平均幀率僅為44 FPS,且1% Low 幀率僅為35 FPS,延遲為52ms,而開啟DLSS 2之后,平均幀率達到了60,且1% Low 幀率也上升到了47 FPS,延遲也降低到了47ms。可以算是流暢運行了。
而iGame GeForce RTX 4090 Neptune OC在未開啟DLSS時,平均幀率便已經有69 FPS了,且 1% Low 幀率也有52 FPS,延遲為33ms,算是很流暢的運行。
僅開啟DLSS 2.0時,iGame GeForce RTX 4090 Neptune OC的平均幀率達到了103 FPS,且 1% Low 幀率也有73 FPS,此時延遲最低,僅為25ms。
而當iGame GeForce RTX 4090 Neptune OC開啟DLSS 3專有的Frame Generation 幀生成功能時,平均幀率達到了可怕的 188 FPS,且 1% Low 幀率也有154 FPS,此時延遲為30ms,甚至比4K原生分辨率還低一些。
可見,開啟DLSS 3時,可以大幅提升游戲幀率(為原生4K分辨率時幀率的272%),且并不會增加延遲。
▲在《瘟疫傳說:安魂曲》的測試中,RTX 3090 Ti在未開啟DLSS時平均幀率為78 FPS,1% Low 幀率為52 FPS,延遲為55ms,而開啟DLSS 2之后,平均幀率達到了103,且1% Low 幀率也上升到了79 FPS,延遲也降低到了44ms。都能夠比較流暢的運行游戲。
而iGame GeForce RTX 4090 Neptune OC在未開啟DLSS時,平均幀率便已經有123 FPS了,且 1% Low 幀率也有91 FPS,延遲為30ms,算是很流暢的運行。
僅開啟DLSS 2.0時,iGame GeForce RTX 4090 Neptune OC的平均幀率達到了146 FPS,且 1% Low 幀率也有123 FPS,此時延遲最低,僅為21ms。
而當RiGame GeForce RTX 4090 Neptune OC開啟DLSS 3專有的Frame Generation 幀生成功能時,平均幀率達到了可怕的 192 FPS(為原生4K分辨率時幀率的156%),且 1% Low 幀率也有167 FPS,此時延遲為40ms,比4K原生分辨率延遲高一些,不過換來了幀數(shù)的大幅提升,完全可以接受。
▲感謝EPIC給我們送上了古墓麗影三部曲,暗影是其最后一部,是一個測試光線追蹤與DLSS性能很好的游戲,只不過目前只支持DLSS 2,所以兩塊顯卡都使用DLSS 2進行測試,且因其有3個測試場景,過場黑屏會影響FrameView的幀率統(tǒng)計,所以這里改為了使用Benchmark內置的5%Low進行比較。
▲在《古墓麗影:暗影》的Benchmark測試中,RTX 3090 Ti在未開啟DLSS時平均幀率為70 FPS,5% Low 幀率為58 FPS,而開啟DLSS 2之后,平均幀率達到了131,且5% Low 幀率也上升到了112 FPS,都能夠比較流暢的運行游戲。
而iGame GeForce RTX 4090 Neptune OC在未開啟DLSS時,平均幀率便已經有122 FPS了,且 5% Low 幀率也有102 FPS,延遲為30ms,算是很流暢的運行。
僅開啟DLSS 2.0時,iGame GeForce RTX 4090 Neptune OC的平均幀率達到了213 FPS,且 5% Low 幀率也有95FPS,已經超越了目前顯示器的極限。
▲《地鐵:離去》是全球首款支持RTX光線追蹤的游戲,由4A Games開發(fā),因為其自帶功能選項非常齊全的BenchMark,成為了眾多裝機愛好者們必備的跑分神器。其更新后的加強版支持全新光線追蹤技術與DLSS 2.0,是一個很不錯的跑分游戲。
▲因為其BenchMark本身統(tǒng)計的便是99%平均(去掉最低與最高)的幀率,所以直接用官方數(shù)據(jù)了。在其Benchmark測試中,RTX 3090 Ti在未開啟DLSS時平均幀率為41.29 FPS,能夠體驗劇情,而開啟DLSS 2之后,平均幀率達到了79.78,算是都能夠比較流暢的運行游戲。
而iGame GeForce RTX 4090 Neptune OC在未開啟DLSS時,平均幀率便已經有56.82 FPS了,可以跑滿4K 60Hz的顯示器。
而開啟DLSS 2.0時,iGame GeForce RTX 4090 Neptune OC的平均幀率達到了125.16 FPS,值得為其配備4K 144Hz的顯示器了。
▲國內網(wǎng)游大廠網(wǎng)易一直與英偉達保持著深度合作,在其游戲開發(fā)過程中大量使用諸如RTX、DLSS等英偉達的先進畫面技術,而逆水寒新發(fā)布“拂云庭”場景便是全程圍繞“微光渲染”設計制作,同時支持RTX與DLSS 3,我玩的是媒體測試服,正式服將于10月13日正式更新,敬請期待。
▲在實際測試中,RTX 3090 Ti開啟DLSS 2之后勉強能玩,為20 FPS,而iGame GeForce RTX 4090 Neptune OC在不開啟DLSS時便有18 FPS,開啟DLSS 3之后更是達到了82 FPS,可以說是很流暢了。
▲這里允許我多嘴一句,開發(fā)游戲技術最前沿的光追游戲,難免有網(wǎng)易在炫技的成分,不過能夠做到讓英偉達將這款游戲選入官方測評指南,并將菜單翻譯成英文,讓全球媒體與玩家都能夠體驗到支持光線追蹤網(wǎng)游大作,我只想說網(wǎng)易干得漂亮,這樣的游戲越多越好。
自從英偉達在安培架構中新增了RTX 3090與RTX 3090 Ti這兩款24GB顯存的顯卡,可以說將圖靈架構時代單獨命名的TITAN RTX這個生產力工具級別的顯卡正式并入了GeForce RTX系列。
這里我們比較一下TITAN RTX、RTX 3090 Ti、RTX 4090這三張生產力顯卡的參數(shù):
TITAN RTX便已經搭載了24GB的GDDR6顯存,RTX 3090 (Ti)更是將其升級到了帶寬更高,速度更快的GDDR6X,而在最新的RTX 4090,得益于GPU制程的提升,顯卡的核心頻率得到了極大的提升,進而,理論上,生產力軟件的運行速度也得到了巨幅的提升。
因為黃昏我并沒有TITAN RTX,所以本次將只實測安培架構的巔峰之作RTX 3090 Ti與目前的最強顯卡,ADA架構的iGame GeForce RTX 4090 Neptune OC,讓我們看一看,全新的ADA架構顯卡,生產力性能到底有多大的進化!
▲首先我們使用V-Ray 5 Benchmark進行測試,這款軟件內置了3個測評項目,分別為用于測試CPU的V-Ray測試,可以同時測試CPU與GPU的V-Ray GPU CUDA,以及考驗顯卡RTX渲染功能的V-Ray GPU RTX測試。本次測試中我們只測試V-Ray GPU CUDA測試的單GPU模式與V-Ray GPU RTX測試。
▲RTX 3090 Ti的V-Ray GPU CUDA得分為1793分,而iGame GeForce RTX 4090 Neptune OC的得分為4133分,是RTX 3090 Ti得分的230.5%!
▲RTX 3090 Ti的V-Ray GPU RTX得分為2337分,而iGame GeForce RTX 4090 Neptune OC的得分為5542分,是RTX 3090 Ti得分的237.1%!
▲OctaneBench是目前最流行的GPU渲染基準測試之一,其內置了一系列渲染測試。
▲RTX 3090 Ti的OctaneBench得分為528.22分。
▲iGame GeForce RTX 4090 Neptune OC的OctaneBench得分為1259.97分,是iGame GeForce RTX 4090 Neptune OC得分的238.5%!
▲Blender是一款開源 3D 創(chuàng)建套件。它支持3D 建模、動畫、視頻編輯等諸多功能,同時支持NVIDIA RTX 渲染OptiX AI 降噪。在RTX 3090 Ti的測試中,我便使用了junk shop進行了光追渲染測試。
而Blender Open Data Benchmark將進行monster、junkshop、classroom三個場景的渲染測試。
▲RTX 3090 Ti的測試中,monster、junkshop、classroom三個場景得分分別為2628,1358,1105分。
▲iGame GeForce RTX 4090 Neptune OC monster、junkshop、classroom三個場景的得分分別為6492,2736,2672分。分別是RTX 3090 Ti得分的247%、201%、242%。
從以上3個Benchmark的比較中可以得出,iGame GeForce RTX 4090 Neptune OC的渲染能力基本上是RTX 3090 Ti的240%左右,這可以說是一個質的飛躍,如果你目前正在使用RTX 3090 Ti或RTX 3090及更舊的顯卡進行大量的渲染工作,那么我強烈建議你升級到iGame GeForce RTX 4090 Neptune OC顯卡,它能夠大幅降低你的時間成本與人力成本。
▲在之前RTX 3090 Ti首測的時候,我便比較了七彩虹iGame GeForce RTX 3090 Ti Vulcan OC與iGame GeForce RTX 3080 OC 10G在生產力方面的性能差異。
▲在測試過程中,10GBDDR6X顯存的iGame GeForce RTX 3080 OC 10G經常會出現(xiàn)爆顯存的情況而導致的無法勝任渲染工作。
▲雖然有些像Octane Render這類的軟件可以借用系統(tǒng)RAM繼續(xù)渲染工作,但是內存的傳輸速度要明顯低于顯存的,會大幅影響渲染效率。
而在當時的測試中,RTX 3090 Ti則順利的完成了渲染工作,而iGame GeForce RTX 4090 Neptune OC同樣為24GB顯存,且上面已經測試了其渲染能力要比RTX 3090 Ti強很多,這里就不再進行重復測試了。
因此,條件允許的話,個人還是不建議使用RTX 3080這類10GB-12GB顯存進行生產力工作,至少要上RTX 3090及以上的顯卡才能夠保證生產效率與穩(wěn)定性。
▲NVIDIA OMNIVERSE MACHINIMA可以從游戲,素材庫等資源庫導入視頻素材,并通過RTX渲染器進行渲染,疊加以語音自動生成面部表情技術,物理引擎計算,AI動作采集等,將素材整合成整體的畫面。
▲不同類型的內容創(chuàng)作者,都可以使用NVIDIA OMNIVERSE MACHINIMA進行實時的RTX內容創(chuàng)作與協(xié)作。
▲借由實時動態(tài)光線追蹤技術所渲染的圖片,已經達到了亂真的程度。
▲同時,針對人物的面部動作,還可以通過導入音頻進行面部細節(jié)動作的自動渲染,這樣,生成視頻中的人物就不會“木偶感”十足了,同時還剩下的大量的面部東西捕捉工作,讓人們能夠更加專注在內容本身的創(chuàng)作上。
▲動作捕捉,這點不用多解釋了吧,很多電影和游戲,之前都是由專業(yè)人士穿著補滿傳感器的衣服執(zhí)行那個動作,然后再進行建模,設備成本很高,而通過AI姿勢估計功能,則只需要一個攝像頭,成本降低明顯,且修改動作也變得更加容易了。
將以上這些功能整合起來,視頻愛好者就可以相對輕松的創(chuàng)作出屬于自己的“史詩般宏偉”的視頻作品了。而對于直播主等,NVIDIA BROADCAST則可以幫助他們更加輕松的進行直播。
▲NVIDIA BROADCAST通過智能降噪,虛擬背景,攝像頭自動成像功能,將直播主的人像視頻源直接合成到主要視頻源上,達到炫酷的效果。
▲音頻采集時自動降噪,AI自動采集直播主的人像部分,完全無需綠布,就可以扣去背景,再將其無縫融入到直播的視頻中去。
嗯,簡單總結下NVIDIA BROADCAST,它可以幫助直播主開電腦就開始工作而無需綠布背景,更省時間,更省空間。
RTX 4090既是生產力工具,又是最高端的游戲顯卡。不僅能夠勝任8K RAW視頻加特效、3D渲染等工作,還能夠非常流暢的在8K分辨率下游玩光追3A大作,不愧為NVIDIA RTX 40系列的首發(fā)護航之作了。
關于購買建議,如果你預算有限,而且只是為了在4K或2K分辨率下玩游戲,那么你可以再等等未來的RTX 4080系列,而如果你打算拿顯卡在8K分辨率或4K分辨率高刷新率下玩光追大作,那么RTX 4090還是很有必要入手的。而如果你用顯卡作為干飯的工具,那么即使你有RTX 3090 (Ti)顯卡,個人都覺得值得升級。
如果你手頭已經有RTX 3090,那么無論當作生產力工具還是玩游戲,都可以再等等。而如果
本次評測所使用的七彩虹iGame GeForce RTX 4090 Neptune OC顯卡,在做工和用料上可以說是整個市面上RTX 4090顯卡的金字塔尖了。七彩虹作為顯卡銷量第一的品牌,在性能,設計,做工上一直在精益求精,比如我測試的這款七彩虹iGame GeForce RTX 4090 Neptune OC顯卡相較于上代安培架構iGame Neptune顯卡有著明顯的設計與做工的提升,三風扇的白水神實在是太美了,散熱能力也大幅增強,無一不是為了提高玩家體驗而設計,在這一點上,我十分欣賞,必須要給七彩虹點一個大大的贊。目前顯卡價格已經回歸原價,且RTX 40系顯卡無需擔心礦卡困擾,剛需的朋友們可以入手了。
▲12代酷睿首發(fā)時我便拿到了i9-12900K,雖然現(xiàn)在13代酷睿已經發(fā)布并預售,不過因為其性能測試尚未解禁,所以我繼續(xù)使用12代酷睿來進行測試。
▲Intel 在12代酷睿上首次使用了大小核心設計,i9-12900K/KF共有16個核心,其中分為8個性能核(P核)+與能效核(E核),其中性能核支持多線程技術,主要用于對核心性能要求高的游戲與生產力需求,而能效核不支持超線程技術,用于多任務處理。因此i9-12900K為一款16核24線程的處理器。
▲iGame是七彩虹的旗艦系列產品,在主板方面iGame系列則可細分為VULCAN(頂配)與ULTRA(次頂配),本次測評所使用的是iGame Z690D5 ULTRA V20價格不高,且支持最新的13代酷睿,是十分不錯的白色主題裝機主板。
▲iGame Z690D5 ULTRA V20采用的是18+1相Dr.MOS供電設計,配合著雙8PIN的CPU供電接口,電力充足,即使作為i9-12900K的座駕也絲毫不虛。其上搭載的DDR5內存插槽,官方標稱支持OC 6200+,足以滿足目前市面上高端DDR5內存的XMP需求。
▲測試內存采用的是宏碁掠奪者 Vesta Ⅱ DDR5內存,其XMP頻率與時序為6000MHz CL30,不出意外是目前市面上時序最低的DDR5內存之一。
▲其在XMP頻率與時序下的讀取速度為94561 MB/s,寫入速度為84182 MB/s,復制速度為84995 MB/s,更重要的是,其延遲僅為62.8 ns!已經遠超DDR4內存所能達到的極限了。
▲而在是ROG STRIX Z690-I 主板上,其可以超頻至6667MHz CL32或6800MHz CL40,其在6667MHz CL32時性能最強,內存的讀取速度、寫入速度、復制速度均有明顯提升,讀取速度、寫入速度與復制速度都摸到6位數(shù)了!而隨著電壓的增強,內存的延時也有小幅下降。
▲SSD 固態(tài)硬盤則采用的是Lexar雷克沙 PCIe 4.0固態(tài)中的高端款NM800PRO 1TB版本,其標稱讀取速度高達7500MB/s,標稱寫入速度6500MB/s。
▲在Crystal Disk Mark實測中,Laxer雷克沙 NM800PRO的順序讀取速度為7443MB/s,順序寫入速度為6378MB/s,尤其是其7400MB/s以上的讀取速度,絕對屬于目前PCIe 4.0 SSD的第一梯隊,可以保證本次顯卡的游戲測試部分,SSD不會成為性能瓶頸。
▲另外,Laxer雷克沙 NM800PRO采用12nm先進制程主控,PCB布局更緊湊,最大支持2TB容量,同時還擁有散熱馬甲版本銷售,因此適用主板更加多元化。
▲這款機箱的模塊化成都非常高,基本上每一塊都可以拆卸或移動,走線時非常方便。
▲雖然這款機箱的兩側均為玻璃制成,但因為背面有著走線擋板的存在,哪怕不是理線高手,也可以把線藏得無影無形,做到眼不見則心不煩。
▲另外,同時支持雙360冷排,顯卡豎裝等,也使得這款顯卡成為了數(shù)一數(shù)二的水冷顯卡、高端裝機的優(yōu)選機箱。
▲電源選用的是鑫谷的昆侖 KL-1250G冰山版,第一原因自然是它是白色的,而更深層次的原因則是其是首批ATX 3.0電源。
▲ATX 3.0電源最明顯特征便是其帶有原生12VHPWR 16針接口,無需轉換即可為RTX 3090 Ti與RTX 4090這類PCIe 5.0標準的顯卡供電,昆侖還能夠提供12V三倍動態(tài)過載的能力,為顯卡工作提供穩(wěn)定的保障。這款鑫谷 昆侖 KL-1250G冰山版擁有兩個16針接口,可在600W,450W,300W,150W4個檔次為不同級別的顯卡提供供電。
▲除此之外,它還提供了6個IDE/SATA供電接口,4個PCI-E供電接口與2個CPU供電接口,當然,主板的28PIN供電接口自然也不會缺席。
▲最后,這款電源達到了80 PLUS金牌標準,并擁有10年全球聯(lián)保,買得放心,用的安心。
▲選擇這款水冷最主要的原因便是其是白色的,而且有著不俗的散熱能力。
▲最后,冷頭的顏色,也很好看。當然,鑫谷還有一款更強的昆侖360,那款可以同時為CPU周邊的其它部件進行風冷散熱,只不過那款水冷的水管與冷排是黑色的,這里便沒有選用。
▲如果有朋友們覺得RTX 4090還是太貴,想等等RTX 4080\RTX 4070,又手癢難耐,想裝機的話,可以考慮入手這款iGame 奇趣主機玩玩,這款主機主題的積木最大的優(yōu)點是其拼裝方式與真機一樣,也是先主板,再內存顯卡的裝法,且每一樣產品都有iGame產品原型,這臺主機便是iGame的m600型電競整機,以可取下式開關為趣味賣點。
▲主板是本次測試使用的七彩虹 iGame Z690D5 Ultra V20,大家認出來了吧?
▲顯卡則是RTX 40系火神顯卡,也算彌補了我RTX 40系沒有測試火神的遺憾。
▲內存應該是這款iGame 旗下采用三星BDie顆粒的DDR4內存,外觀非常漂亮,DDR5主板如何插DDR4內存這種細節(jié),大家就不要在意了哈哈哈。