1前言&顯卡外觀賞析
前言
GeForceRTX4090顯卡已經(jīng)上市有一段時間了,想必大家對它的性能表現(xiàn)已經(jīng)了然于心,而包括公版和非公版在內(nèi)的RTX4090的設(shè)計都相當“規(guī)矩”,現(xiàn)在有張顯卡擺脫了限制,在規(guī)格、配置以及外觀方面都做到了頂尖水平!用料也是極致豪華,就為了給極客玩家?guī)順O致體驗。
沒錯,它就是影馳GeForceRTX4090HOFOCLABPlus顯卡,隸屬于名人堂系列,該系列被廣大玩家稱之為“旗艦中的旗艦”,專為追求極致性能的玩家量身打造,自從HOF系列顯卡推出以來,就不斷有超頻發(fā)燒友及愛好者利用這些顯卡刷新世界超頻紀錄,至今影馳GeForceRTX4090HOFOCLABPlus顯卡已經(jīng)擁有20項超頻紀錄的美譽。
今天我們也有幸上手這張真正的卡皇,下面就給大家送上它的詳細評測。
下文“影馳GeForceRTX4090HOFOCLABPlus”簡稱為“影馳RTX4090HOFOC”
外觀賞析
第一次收到影馳RTX4090HOFOC顯卡的時候還是有些震驚的,畢竟超規(guī)格的外包裝盒從里到位都顯露出這是一種“奢侈品”的感覺,不愧是旗艦之名的顯卡定位。
拆開后,影馳RTX4090HOFOC顯卡仍然采用我們熟悉的家族式的白色涂裝,正面一改之前的鉆石切割工藝,而是換成了更具特色的機甲風(fēng),還戴上了尊貴的象征——皇冠。這樣的設(shè)計不僅擁有豐富的視覺層次感,同時還彰顯出頂級顯卡才具備的高貴氣質(zhì)。
這張影馳RTX4090HOFOC顯卡不止視覺上看起來巨大,體積方面更是重量級,足足有2.7kg重,完全就是一個巨無霸般的存在。
一眾顯卡廠商也是深知這次RTX4090的重量,因此在包裝盒內(nèi)也配備了全金屬通用顯卡支撐桿套件,能夠徹底杜絕顯卡變形,給予顯卡有效保護。
正面搶眼的除了皇冠燈件外,就屬三把巨大的散熱風(fēng)扇了,它們都大到快要撐破顯卡外殼了,左右兩邊的是112mm的靜霜風(fēng)霜,中間的則是92mm,三大特大的散熱風(fēng)扇組成了顯卡不可或缺的主動散熱部分。
將鏡頭拉近,每個散熱風(fēng)扇都配有11片專屬的靜霜葉片,并且扇葉表面明顯經(jīng)過特殊優(yōu)化處理,表面有磨砂質(zhì)感,這樣做的目的是保證顯卡進風(fēng)量,高效散熱保證性能釋放。
顯卡的背面更加驚艷,同樣是全白設(shè)計,不過在設(shè)計上加入了些小巧思,整個背板被大面積的“HOF”Logo覆蓋,并且還配有名人堂特有的皇冠,無不彰顯其高貴地位。
高強度的壓鑄金屬背板比一般的金屬背板更有助鞏固顯卡不易變型,而且還可以提升散熱效能,加上背板末端設(shè)有開孔設(shè)計,有效加強風(fēng)扇氣流,影馳RTX4090HOFOC顯卡在高頻運作下仍能穩(wěn)定耐用。
并且背板上的HOF皇冠Logo標志還是一個RGB燈件,在顯卡接通電源后能夠亮起,與其他硬件同步燈效后,RGB效果更是炸裂。
既然說到RGB,前面提到的可拆式皇冠燈件其實也支持ARGB燈效,其背后藏有一個5VARGB接口,神光同步功能信手捏來。
當它與正面融為一體時,一個璀璨奪目的皇冠躍然紙上,時刻提醒你手上正在使用的影馳RTX4090HOFOC顯卡是尊貴的象征,是性能的象征。
玩家也可通過影馳官方的魔盤XtremeTuner工具自定義燈光效果,多種燈效配合這個顯眼的皇冠設(shè)計別有一番韻味,打造專屬于你的高顏值顯卡。
皇冠燈件除了可以展示炫酷的RGB燈效,還自帶檢測功能,黃燈表示顯卡外接供電異常,而紅燈則表示主板異常,玩家排障更直觀。
皇冠燈件其實是可拆式設(shè)計,即使你的顯卡不是豎裝放置,它也可以拆卸后獨立放置在顯卡頂部,一樣能夠讓你360°欣賞它的美。
卸下皇冠燈件后,隱藏在其之下的“HallOfFame”慢慢顯現(xiàn),影馳幾乎在你看得到的地方都安排了RGB燈效,采用海景房裝機,你將大飽眼福,時刻感受驚艷眾人的ARGB。
你以為這就是玩燈的極限了嗎,影馳RTX4090HOFOC顯卡還有HOFPANELIII多功能外置全彩顯示系統(tǒng),其本質(zhì)是一個LED顯示屏,使用新版的HOFAi軟件,你可以在這塊顯示屏上監(jiān)控顯卡狀態(tài),展示圖片,播放視頻,應(yīng)有盡有。
通體白色的設(shè)計與魅力四射的RGB燈效相結(jié)合,放在白色的側(cè)透機箱內(nèi)恰到好處,既給玩家?guī)砹艘曈X盛宴,又沒有過分高調(diào),更像是一位優(yōu)雅的武林高手,在小小的機箱內(nèi)滿血輸出。
顯卡的頂部和底部都配有大面積的鰭片出風(fēng)口,鰭片的厚度也是相當“離譜”,不過這樣豪華的堆料有利于內(nèi)部空氣的快速流動,降低顯卡核心溫度。
顯卡供電用的是全新的12VHPWR供電接口,使用一根12VHPWR的電源線就可達到供電需求。不過影馳RTX4090HOFOC配備了兩個12VHPWR供電接口,最大能夠給這張顯卡提供1200W的供電能力,帶666W的最大TDP完全足夠了。
供電接口的附近可以看到一個小按鈕,這其實是影馳RTX4090HOFOC的BIOS切換按鈕,用戶通過DualBIOS撥動開關(guān)就能選擇不同的工作模式。左側(cè)還有ARGB的接口,新的AuroraSyncPro功能能夠讓名人堂RTX40系列顯卡與支持5VARGB外接擴展功能的主板實現(xiàn)燈效同步。
顯卡底部還可以看到顯卡的PCIe金手指,標準的PCIe4.0x16速率,它可以為顯卡提供更快的傳輸速度。
視頻輸出接口方面配備了3個DP1.4a和1個HDMI2.1,支持4屏顯示或最高8K@60Hz的超清輸出。視頻輸出接口還專門采用鍍金處理,不僅抗氧化性能更強,還能讓視頻訊號傳輸更清晰。
IO擋板上還有一個小按鈕,其實這是名人堂RTX40系列顯卡才具有的HyperBoost一鍵加速功能,用戶只需要通過功能按鍵就能實現(xiàn)HyperBoost功能一鍵開啟,提高顯卡散熱器效能以及提升GPU超頻能力,同時按鍵上配備了狀態(tài)指示燈,開啟一鍵加速功能,按鍵亮綠燈,關(guān)閉功能時則無燈光。
另外從這個角度也可以看出影馳RTX4090HOFOC顯卡驚人的厚度,足足有77mm,已經(jīng)超越4槽厚度了,妥妥的性能巨獸。
2顯卡拆解
顯卡拆解
影馳RTX4090HOFOC可謂是相當“厚實”,那它的內(nèi)部一定也是堆料十足,我們拆開來一探究竟,卸下影馳RTX4090HOFOC金屬背板上的螺絲后就可以分離散熱系統(tǒng)和PCB。
首先映入眼簾的是一張純白的PCB板,名人堂專屬定制,14層OC工藝加持。整體設(shè)計合理,安排規(guī)整,單從PCB上的接口、供電、核心、顯存等細節(jié)就可以看出這一定是大廠出品的品質(zhì)。
PCB的背面相比正面就要簡潔很多了,不過還是排布了密密麻麻的的電容,影馳為這張RTX4090可以說是煞費苦心,瘋狂堆料。
核心背部電容位置使用了四個POSCAP(導(dǎo)電聚合物鉭電容)代替四組MLCC(一組10個MLCC),整體電氣性能更強。
PCB的正中央就是本次的主角——AD-102-300-A1核心,影馳RTX4090HOCOC顯卡的心臟,別看它小小的一顆,但其實它集成了763億個晶體管,相比RTX3090Ti足足多了2.7倍,稱它是地表最強卡皇都不足為過。
核心的周邊則是12顆GDDR6X顯存,來自美光科技,型號為2RU47D8BZC,單顆顯存容量2GB,12顆組成24GB超大顯存。并且這幾顆顯存的速率可是滿血的,顯存速率為21Gbps。
影馳RTX4090HOFOC在供電MOSFET上也是堆料到了極致,供電總相數(shù)達到了32相之多,其中28相為核心供電,4相為顯存供電,這個規(guī)格基本上在一眾RTX4090中也是Top1的存在。
無論是核心供電還是顯存供電,影馳RTX4090HOFOC全部采用英飛凌的DrMOS芯片,型號為TDA21472,持續(xù)輸出電流可達70A。
不同于其他顯卡的設(shè)計,影馳RTX4090HOFOC采用全新的方案,PWM芯片也來自英飛凌,型號是XDPE1A2G7B,不過目前還查詢不到相關(guān)信息。
附近還有一顆uS5650Q,它主要負責(zé)管理顯存供電部分。與上面的PWM芯片通力合作,為顯卡提供充足動力。
在核心周圍還能看到兩顆BIOS控制芯片,型號為IS25WP016,分別控制這款顯卡的P-Mode與S-Mode。
想要有666W的TDP,單一12VHPWR供電接口是不夠的,影馳RTX4090HOFOC有兩個12VHPWR接口,每個接口都能提供600W的供電能力,雙口完全能夠支撐其這張卡皇。
在兩個供電接口的后方,還有4顆R22電容坐鎮(zhèn),為顯卡電源輸入提供穩(wěn)定安全的保障。
當然供電不止12VHPWR接口一處,PCIe也是供電之一,影馳RTX4090HOFOC的PCIe接口為標準的PCIe4.0x16,值得注意的是使用前一定要在主板打開ResizableBAR功能,這張顯卡的性能才能完全釋放。
奢華至極的不止供電,連視頻輸出接口也是鍍金設(shè)計,抗氧化能力極強,經(jīng)久耐用,還可以有效提升信號傳輸品質(zhì)。
繼續(xù)拆解散熱系統(tǒng),首先見到的便是大面積的液冷均熱板,面積達到了95mm*88mm,如此規(guī)格的配置能夠迅速吸收GPU產(chǎn)生的熱量,并將熱量迅速均勻傳遞到熱管,讓AD102核心時刻保持冷靜。
影馳在均熱板上為顯存、電感、MOS管接觸的地方用上了高系數(shù)的導(dǎo)熱墊輔助散熱。就連核心處也是厚厚的一層硅脂,可見這個散熱系統(tǒng)真的是下足了功夫,堆足了料。
不僅僅正面的均熱板有散熱,金屬背板上同樣安排了導(dǎo)熱墊,配合金屬導(dǎo)熱性強的特性,影馳RTX4090HOFOC的散熱效能可以說是拉滿了。
整個散熱器除了正面的液冷均熱板外,其他地方被大面積的導(dǎo)流型鰭片覆蓋,并且還在部分地方安排了不少加強件,用于保護鰭片不變形。
散熱鰭片下隱藏著4根Φ8mm 5根Φ6mm的鍍鎳復(fù)合熱管,9熱管的配置用于壓制AD102核心綽綽有余。
所有熱管在散熱鰭片下蜿蜒曲折,最終貫穿整個散熱器,并且統(tǒng)統(tǒng)采用回流焊接工藝,有利于保證散熱系統(tǒng)的高效導(dǎo)熱。
三把專屬的靜霜散熱風(fēng)扇是整個散熱系統(tǒng)的主動散熱來源,肩負著加速空氣流動,快速帶離熱量的作用,20mm的厚度設(shè)計讓散熱效能顯著提升,這也是為什么這張顯卡在烤機時能夠做到低溫的原因所在
拆解后細看,每把散熱風(fēng)扇上有11片靜霜扇葉,升級優(yōu)化后不僅進風(fēng)量更大,還支持智能啟停功能,讓顯卡隨時隨地能夠全力輸出。
總的來說,影馳RTX4090HOFOC完全稱得上堆料豪華,極致散熱。旗艦級的AD102核心配上如此規(guī)格的硬件,明顯是為超頻預(yù)留了更多余量,這也是名人堂HOF系列顯卡的“頭號招牌”。
3測試平臺&理論/游戲性能
測試平臺介紹
見識過影馳RTX4090HOF的堆料設(shè)計后,就該進入實測環(huán)節(jié)了,老樣子,我們先介紹一下此次的測試平臺。我們請出了目前最強的游戲硬件,CPU用的是最新的IntelCorei9-13900KS,華碩的Z790Hero主板搭配4根16GB的金士頓DDR5-6000高頻內(nèi)存。
散熱方面也是下足了功夫,用的是鑫谷冰封360冰山版水冷散熱器,只有這個規(guī)格的散熱器才有可能馴服13900KS這顆可以超頻到6.0GHz的性能怪獸。
既然影馳RTX4090HOF是一塊純白色的顯卡,那裝機自然離不開時下最流行的白色主題海景房,機箱上我們選用了昆侖御風(fēng)機箱白色版。其擁有出色的功能支持與驚艷眾人的顏值,非常適合DIY玩家。
昆侖御風(fēng)機箱的風(fēng)道設(shè)計不錯,因此我們在其前后還加裝了多把鑫谷冰霜12散熱風(fēng)扇,不僅能夠給散熱添磚加瓦,在顏值方面也是給白色主題裝機添彩。
有了強悍的硬件,顯示設(shè)備也不能拖后腿,顯示器我們采用了愛攻&保時捷聯(lián)名PD32M電競顯示器,其搭載了目前頂級的4K144Hz面板,可以完美體驗到RTX4090帶來的絲滑4K144Hz游戲體驗。
理論性能測試
正式測試前,我們先在GPU-Z中對影馳RTX4090HOFOC進行一個簡單的了解。從圖中可以看到這款顯卡的基準頻率為2235MHz,Boost頻率為2625MHz,遠遠高于公版FE的2520MHz,這也是其能夠位列“名人堂”的底氣。
另外從GPU-Z中我們還可以了解到這款顯卡的功耗和溫度設(shè)定,眼尖的玩家可能已經(jīng)發(fā)現(xiàn)了,影馳RTX4090HOFOC的默認TGP設(shè)定為550W,這已經(jīng)比普通的RTX4090的最大TGP還要高了,并且這款顯卡支持解鎖功耗至666W,溫度墻也能放寬至88℃,這顯然是為沖擊超頻做足了準備。
接下來我們一起玩一下全世界最好玩的游戲《3DMark》,從3DMark的理論性能來看,影馳RTX4090HOFOC對比上代RTX3090Ti完全是碾壓般的存在,首先是代表DX11的FireStrike測試,性能提升在70%左右。而在代表DX12的TimeSpy測試中,RTX4090與RTX3090Ti也是拉出了遠遠的差距,TimeSpyExtreme直接突破兩萬分大關(guān),這讓筆者很好奇它的游戲表現(xiàn)。
3DMark中的理論性能提升已經(jīng)足夠“離譜”,AIDA64的GPGPU理論性能測試中,影馳RTX4090HOFOC的表現(xiàn)更令人驚喜,整體性能相比RTX3090Ti提升了92%以上,近乎翻倍的性能可謂驚人。不少項目甚至有2倍甚至3倍的飛躍,這才是一張卡皇應(yīng)有的表現(xiàn)。
游戲性能測試
想必買的起這張卡的玩家都是標配4K分辨率的顯示器吧,不過照例我們還是看看1080P與2K分辨率下這張顯卡的表現(xiàn),不得不說卡皇之所以為卡皇就是因為超強的性能釋放,影馳RTX4090HOFOC顯卡在兩個分辨率下,大部分游戲都在200FPS以上,這已經(jīng)不是入門電競的水平了,而是專業(yè)電競的表現(xiàn),現(xiàn)在3A也能用電競的水準游玩,完全不敢想象。
4K分辨率才是這款顯卡的主戰(zhàn)場,從實測結(jié)果中可以看出,有著“顯卡殺手”之稱的《賽博朋克2077》中,影馳RTX4090HOFOC顯卡在DLSS2下已經(jīng)能夠做到77FPS,更不用說性能更強的DLSS3,而RTX3090Ti僅有48FPS,屬實有點不夠看。而在《光明記憶:無限》中,即使是高畫質(zhì)加復(fù)雜光追的苛刻條件下,這代顯卡的表現(xiàn)依舊強勢,87FPS的成績領(lǐng)先前代近70%。
既然都是地表最強游戲顯卡了,不試試8K分辨率怎么行,在8K游戲測試方面,影馳RTX4090HOFOC顯卡能夠?qū)⒋蟛糠钟螒蚺艿?0FPS以上,像一些優(yōu)化好的游戲,例如《極限競速:地平線5》甚至能有85FPS左右,想想8K超高畫質(zhì)馳騁在墨西哥是一種怎樣的視覺享受。
總的來說,用RTX4090已經(jīng)能夠滿足部分游戲運行在8K畫質(zhì)下的需求,相較于RTX3090Ti幾乎是翻倍的提升,如果游戲廠商優(yōu)化到位,8K電競指日可待。
4DLSS 3性能測試
DLSS 3性能測試
提到RTX40系顯卡就不得不提DLSS3這個黑科技了,它無疑是這代顯卡升級的重點,相比DLSS2,DLSS3不僅可以實現(xiàn)畫質(zhì)于幀數(shù)的雙向提升,還新增幀生成功能,實現(xiàn)游戲幀數(shù)翻倍,老黃在發(fā)布會上更是直言“DLSS3讓游戲性能翻倍”!
3DMarkDLSS3理論性能測試
3DMark中新增了DLSS3性能測試,實測下來有DLSS3的加持下,影馳RTX4090HOFOC顯卡相比RTX3090Ti真的實現(xiàn)了性能的翻倍,在4K分辨率下,不開DLSS3僅能勉強維持在60FPS附近,一旦開啟DLSS3后,性能直接提升三倍,已經(jīng)可以滿足4K@144Hz的電競需求。
8K分辨率下更是離譜,不開DLSS3只可以13FPS,測試過程卡成PPT,而開啟DLSS3后,幀數(shù)暴漲80FPS,逼近百幀,相較上代提升3倍有多,似乎已經(jīng)可以開始期待8K@120Hz甚至8K@144Hz了。
游戲?qū)崪y
光說不練假把式,現(xiàn)在《賽博朋克2077》也更新了DLSS3,所以我們也在第一時間測試了DLSS3與DLSS2下的區(qū)別,實測下來可以看到4K分辨率下,有了DLSS3的加持后,游戲幀數(shù)能夠進一步提升,并且提升幅度還不小。
2K或1080P的情況下提升幅度更加明顯,幾乎是近百幀的性能差距。不得不說DLSS3是一個劃時代的技術(shù),體驗下來真的非常棒,它能讓低端卡玩游戲變快,高端卡變得更快。
在另一款支持DLSS3的《F122》中也是如此,在4K畫質(zhì)下開啟全高特效,有了DLSS3的加成,影馳RTX4090HOF能夠跑到175幀,若只使用DLSS2,則幀數(shù)只有133幀左右,相當于DLSS3這個黑科技給游戲帶來了32%的游戲性能提升,相當不錯。
總的來說,影馳RTX4090HOFOC顯卡不開啟DLSS功能的游戲性能已經(jīng)足夠了,開啟DLSS3后,無論是質(zhì)量檔還是性能檔,其游戲流暢度都高于120FPS,對于一款賽車游戲來說,這流暢度是真再爽不過了。
當然不少玩家可能擔(dān)心DLSS3會有降畫質(zhì)的問題,這里我們也截取了DLSS3各個檔位下的游戲?qū)嶋H畫面,可以看到無論是哪個檔次,游戲畫質(zhì)均沒有明顯影響,甚至因為DLSS3是通過AI進行超分渲染,因此在文字等細節(jié)紋理上會比原生畫質(zhì)更加清晰。
DLSS3-F122-DLSS-Balance
DLSS3-F122-DLSS-Perfoemance
DLSS3-F122-DLSS-Quality
DLSS3-F122-DLSS-SuperPerfoemance
DLSS3-F122-TAA
UnrealEngine5LyraDLSS3測試
最后我們還測試了利用UnrealEngine5引擎打造的LyraDEMO,此DEMO除了能夠支持最新的DLSS3技術(shù)外,還帶上了NVIDIAReflex。筆者這里上傳了兩個圖片給大家看看LyraDEMO里的DLSS3開啟與關(guān)閉的畫質(zhì)對比,游戲流暢度自然是DLSS3開啟后提升較為明顯的,達到192FPS,而PCL延遲也進一步降低到了50ms的水平。
Unreal-Engine-5-Lyra-DLSS3-OFF
Unreal-Engine-5-Lyra-DLSS3-ON
5生產(chǎn)力性能測試
視頻內(nèi)容創(chuàng)作性能測試
測完了游戲,必不可少的還有創(chuàng)作生產(chǎn)力測試,這里我們選擇PugetBench、PCMark10、等多款常見的測試軟件,來測試影馳RTX4090HOFOC顯卡在日常辦公、視頻內(nèi)容生產(chǎn)等方面的性能表現(xiàn)。
首先我們來看看PCMark10Extended項目上各顯卡的性能表現(xiàn)如何,可以看到影馳RTX4090HOFOC顯卡在各個項目均完成了對前代卡皇RTX3090Ti的超越,這與我們上面的實測相符。
影馳RTX4090HOFOC顯卡在更快的顯存、更強的性能加持下,跑Pugetbench的Pr項目確實比前代卡皇快了很多,有大約30%的性能提升,換用新顯卡對剪視頻、預(yù)覽、導(dǎo)出等操作均有幫助;Ae項目沒有Pr進步那么大,但總歸于是新顯卡,還是有一定性能提升的。
要說提升最大的要屬達芬奇了,作為首批支持AV1編解碼的剪輯軟件,占盡優(yōu)勢,同一項目下,架構(gòu)革新后的影馳RTX4090HOFOC有著更快的渲染時間,原本RTX3090Ti需要幾十秒才能完成的操作,現(xiàn)在僅用17秒!如果你習(xí)慣用達芬奇進行創(chuàng)作,那換用影馳RTX4090HOFOC顯卡將大幅提升你的工作效率。
專業(yè)內(nèi)容創(chuàng)作性能測試
另一個提升可感的行業(yè)就是3D渲染了,Blender與OctanceBench測試中影馳RTX4090HOFOC顯卡的性能表現(xiàn)同樣給力,相比前代RTX3090Ti有95%以上的性能提升。翻譯成人話就是你用影馳RTX4090HOFOC顯卡渲染一個相同的項目,它的耗時只需要前代顯卡的一半!
即使是在SPEX的專業(yè)領(lǐng)域測試中,影馳RTX4090HOFOC顯卡也沒讓人失望,有了更快的顯存和全新的架構(gòu)加持后,可以說完全打通了AD102核心的任督二脈,比起上代旗艦來說,65%的性能提升相當驚人,這個成績也比其他RTX4090顯卡高了近10%。
總的來說,40系顯卡這一代光追單元的增強,對于支持光追加速的3D渲染軟件是很有利的,多款渲染軟件相比上代卡皇的提升都接近2倍,因此對于從事這些相關(guān)工作的用戶,影馳RTX4090HOFOC這款顯卡還是值得考慮的。
雙編碼器專項測試
RTX40系顯卡還有一個重磅升級點就是支持最新的AV1編解碼,這次影馳RTX4090HOFOCLABPlus換上了最新的雙NVENC編碼器,作為第八代NVENC編碼器,其編解碼性能相比前代有了質(zhì)的飛躍。
最新的RTX4090顯卡支持AV1編碼,而RTX3090Ti僅支持AV1解碼,二者差距相當明顯,新的AV1編碼技術(shù)能夠在占用相同空間情況下,提供更加快速的視頻編碼和更高質(zhì)量的流媒體傳輸性能,并且目前許多主流媒體也逐步支持AV1編碼,像達芬奇、萬興喵影、剪映等軟件均已支持AV1編碼。
我們使用NVIDIA提供的8K片源與工程文件進行測試,同樣的素材下AV1編碼相比H.265編碼所需時間更短,而即使同為H.265格式導(dǎo)出,影馳RTX4090HOFOCLABPlus的導(dǎo)出時長也比前作快了70%以上。
另外我們來看看H.265格式與AV1格式下的畫質(zhì)區(qū)別,從肉眼來看,其實畫質(zhì)幾乎完全一樣,這樣也意味著AV1可以用更小的空間占用量實現(xiàn)與H.265同等規(guī)格的畫質(zhì)表現(xiàn),總的來說,無論是導(dǎo)出速度、空間占用還是畫質(zhì)表現(xiàn),它都完勝H.265。
6功耗&超頻&總結(jié)
超頻體驗
在拆解部分我們看到影馳給這張RTX4090HOFOC顯卡安排了超規(guī)格的供電模組與散熱裝置,并且TDP給到了最高的666W,可見超頻就是它的最強殺招,那筆者自然是不可能錯過這個絕佳的機會,下面一同看看這款顯卡的超頻潛力究竟有多大吧。
我們使用影馳官方提供的XTREMETUNER魔盤工具對顯卡進行超頻,這款工具不僅可以解鎖GPU核心的電壓限制、功耗限制等,還可以自由調(diào)節(jié)風(fēng)扇轉(zhuǎn)速,實測這款顯卡的散熱配置明顯是超規(guī)格的,因此風(fēng)扇轉(zhuǎn)速還可以進一步下探,超低的風(fēng)扇噪音還你舒適的使用體驗。
在解鎖了功耗與溫度墻后,我們先小試牛刀,將GPU核心頻率先提升至3090MHz,此時顯卡在運行TimeSpy時已經(jīng)超過了4W分大關(guān),并且功耗也突破了550W,要知道這是其他RTX4090都達不到的地步。并且在測試過程中溫度始終沒有突破60℃,明顯這是高規(guī)格的散熱系統(tǒng)起到了作用。
有了前面的嘗試后,我們穩(wěn)步提升,筆者最后成功將影馳RTX4090HOFOC的GPU核心頻率提升了235MHz,顯存頻率提升了1000MHz,最終影馳RTX4090HOFOC在3DMark中能夠穩(wěn)定運行在3150MHz下,這還只是在風(fēng)冷狀態(tài)下,如果是水冷,那它還能再高一些,此時TimeSpy測試得分40459,相比默頻狀態(tài)的38155分提高2000多分,超頻潛力可見一斑。
功耗與散熱
前文中我們提到,影馳RTX4090HOFOC顯卡采用了非常優(yōu)秀的散熱設(shè)計,那么這款顯卡在散熱性能測試中的實際表現(xiàn)如何呢?
在使用Furmark烤機15分鐘后,這款顯卡的GPU溫度穩(wěn)定在65.5℃,這樣的成績比起上代的RTX3090Ti可以說是質(zhì)的飛躍,如果跟其他RTX4090比起來,那也是妥妥的第一梯隊,可見其散熱效率的確非常高。
再聊聊內(nèi)部的發(fā)熱大戶——GDDR6X顯存,筆者原以為顯存溫度也會較高,但沒想到有高系數(shù)導(dǎo)熱墊直觸均熱板后,顯存溫度只比核心高了0.5℃,果然旗艦級的顯卡散熱都不是蓋的,用這套散熱系統(tǒng)壓制AD102核心已經(jīng)綽綽有余了。
我們也橫向?qū)Ρ攘艘幌掠榜YRTX4090HOFOC顯卡與上代卡皇的功耗,從功耗來看,解鎖了功耗墻的影馳RTX4090HOFOC的確驚人,不過相比其前代卡皇,它的功耗可以說是相當保守了,不少項目測試下來,功耗都沒有上代那么高,但性能提升卻是實打?qū)嵉膹姟?/p>
不得不說老黃的AdaLovelace架構(gòu)和TSMC的4N工藝確實有點東西,妥妥的吊打前代顯卡,讓RTX40系列顯卡的每瓦性能實打?qū)嵉奶嵘搅艘粋€新高度。
評測總結(jié)
這次能夠上手這張影馳GeForceRTX4090HOFOCLABPlus顯卡還是相當幸運的。全新AdaLovelace架構(gòu)、TSMC4N定制工藝、DLSS3等數(shù)不勝數(shù)的黑科技聚集于一身,讓這張顯卡無論是游戲性能還是專業(yè)生產(chǎn)力都遙遙領(lǐng)先RTX3090Ti,不愧為地表最強游戲顯卡。
而影馳GeForceRTX4090HOFOCLABPlus顯卡本身更是極致奢華的代表,無論是性能、顏值、還是配置都是當今最強的RTX4090之一。因此對于游戲玩家來說,游戲幀數(shù)、散熱表現(xiàn)都是旗艦中的旗艦;除此之外它的雙12VHPWR供電以及32相的豪華供電規(guī)模則為硬核的超頻玩家提供了絕佳的舞臺,風(fēng)冷下輕松超3.1GHz,完美詮釋了頂級非公應(yīng)有的表現(xiàn)。
一身白衣加身的影馳GeForceRTX4090HOFOCLABPlus也是賺足了眼球,光是皇冠燈件就彰顯了這張顯卡的高端定位。純白色的設(shè)計配上極具個性的棱角線條,奢華而優(yōu)雅的外觀無疑是顏值黨的最佳選擇。
總的來說,如果你想見識一下頂尖的RTX4090顯卡,那影馳GeForceRTX4090HOFOCLABPlus就是你的不二之選。最高666W的功耗能夠完全榨干AD102核心,兩倍于前代卡皇的性能表現(xiàn),毫無疑問,它就是目前地表的性能王者,幾乎沒有對手能與之抗衡?,F(xiàn)在影馳GeForceRTX4090HOFOCLABPlus已經(jīng)上市,售價19999元,各大??電商平臺均已開售??,感興趣的話可以去了解一下。
7Ada Lovelace架構(gòu)講解
Ada Lovelace架構(gòu)講解
Turing、Ampere上兩代架構(gòu)核心均以人物來命名,前者是計算機科學(xué)之父——艾倫·麥席森·圖靈;后者則是“電學(xué)中的牛頓”——安德烈·瑪麗·安培,電流的國際單位安培就是以其姓氏命名。那AdaLovelace定非凡人,度娘一下果然,這是 人稱“數(shù)字女王”的阿達·洛芙萊斯,編寫了歷史上首款電腦程序,是被世界公認的第一位計算機程序員,果真是一代比一代還要更牛。PS:她的父親是《唐璜》的作者,詩人拜倫喔。
從Turing架構(gòu)開始,NVIDIA首次在顯卡中加入了加速光線追蹤的RTCore單元,以及面向AI推理的TensorCore單元,這革命性的創(chuàng)新使實時光線追蹤成為可能。而Ampere架構(gòu)則是全面的架構(gòu)改進,在加入新一代的二代RTCore和三代TensorCore基礎(chǔ)上,還有著更先進的SM單元設(shè)計,這樣顯卡工作效率那是翻倍的提升。而來到AdaLovelace架構(gòu),同時是以效率提升為大前提,自然是引入了最新的第三代RTCores與第四代TensorCores單元,同時加入眾多新穎的黑科技,從執(zhí)行效率來說AdaLovelace架構(gòu)是上代Ampere架構(gòu)的2倍以上,甚至光線追蹤能力更是達到了恐怖的4倍性能。
在講述核心架構(gòu)前,我們先了解幾個關(guān)鍵詞:GeForceRTX4090、AdaLovelace、TSMC4N、608mm2、760億個晶體管、2倍性能功耗比。
大家?guī)е鴰讉€關(guān)鍵字來看上面的【顯卡規(guī)格參數(shù)對比】表格,就可以更容易讀懂上述表格了。最新一代的桌面顯卡GeForceRTX40系列均采用全新的AdaLovelace架構(gòu)核心,GeForceRTX4090的核心是AD102,目前AdaLovelace架構(gòu)核心中最為強大的,具有760億個晶體管、16384個CUDA核心和24GB高速美光GDDR6X顯存。
得益于NVIDIA與臺積電深度合作的TSMC4N制程工藝,GeForceRTX4090核心面積僅是608mm2(上代RTX3090Ti628mm2),在更小的核心面積下卻能塞下多達760億個晶體管,比上一代的Ampere架構(gòu)多出了約70%晶體管數(shù)量。
值得注意的是,制程工藝的提升不單能擁有更多的晶體管,其核心頻率更是能跑得很高,GeForceRTX4090Boost頻率就已經(jīng)達到了2520MHz,這樣在核心頻率與高規(guī)格的雙向保證下實現(xiàn)了比上代顯卡高達2倍的性能功耗比。
從GTC2022秋季大會中,其實我們就已經(jīng)發(fā)現(xiàn)了,目前GeForceRTX4090顯卡中配備的AD102-300核心其實并非完整的AD102核心。完整的AD102核心應(yīng)該包括了12個GPC(圖形處理集群)、72個TPC(紋理處理集群)、144個SM(流式多處理器)和?個帶有12個32Bit顯存控制器的384Bit顯存位寬。
再來看上面的GeForceRTX4090架構(gòu)圖,和完整版本的AD102核心對比起來就很容易看出差別。首先,GeForceRTX4090核心代號為AD102-300,其擁有9個完整規(guī)格的GPC(圖形處理集群,每個內(nèi)建6個TPC),與2個非完整的GPC(圖形處理集群,每個內(nèi)建5個TPC),共組成了64個TPC,那么SM單元自然就是128個了。至于顯存位寬方向那是相當?shù)耐暾?84Bit。
如果你還是不太懂,這里筆者就逐一為了AdaLovelace架構(gòu)顯卡的構(gòu)成。
剛才我們已經(jīng)說到,一個完整的AdaLovelace架構(gòu)AD102核心內(nèi)部擁有12個GPC,而每個完整的GPC中包含了一個專用的RasterEngine(光柵化引擎),兩組ROPs共16個ROP(光柵化處理單元),以及6個TPC與12個SM單元。
全新的SM流式多處理器
AdaLovelace架構(gòu)中最大的亮點之一:全新的SM流式多處理器,每個SM包含了128個CUDA核心、1個第三代的RTCores,4個第四代TensorCores(張量核心)、4個TextureUnits(紋理單元)、256KBRegisterFile(寄存器堆),以及128KBL1數(shù)據(jù)緩存/共享內(nèi)存子系統(tǒng),于是這一個全新的SM單元有著超過上一代2倍之的性能表現(xiàn)。
過去的Turing架構(gòu)INT32計算單元與FP32數(shù)量是一致的,而兩者相加才組成了64個CUDA核心。但是Ampere架構(gòu)開始,左側(cè)的計算單元實現(xiàn)了FP32 INT32的計算單元并發(fā)執(zhí)行,也就是說CUDA核心數(shù)量翻倍到了128個。
再來看看AdaLovelace架構(gòu)的SM,F(xiàn)P32/INT32的計算單元組合,同樣實現(xiàn)了每個SM內(nèi)含128個CUDA的設(shè)計,看似提升不大,但是當你了解到GeForceRTX4090擁有128個SM,16384個CUDA核心,那你也就應(yīng)該明白達82.6TFLOPS的著色器能力是如何實現(xiàn)的了,比上一代的RTX3090Ti顯卡的40TFLOPS,還真是提升了兩倍有多。
另外緩存方面AdaLovelace架構(gòu)也進行了大規(guī)格的提升,首先每個SM單元中單獨配上了128KB的緩存,這樣RTX4090顯卡中就實現(xiàn)了163MBL1/共享內(nèi)存。其次核心的二級緩存進行進行了重新的設(shè)計,并且完整AD102核心是96MB二級緩存,而RTX4090顯卡擁有72MB二級緩存,也可能是因此AdaLovelace架構(gòu)核心對顯存位寬的依賴性并不高。
8第三代RT Cores與第四代Tensor Cores
技術(shù)講解:第三代RT Cores與第四代Tensor Cores
以為剛才的CUDA數(shù)量與超大L2緩存就已經(jīng)很猛了,實現(xiàn)上AdaLovelace架構(gòu)最大的提升還是在第三代RTCores與第四代TensorCores身上。
第三代RTCores
RTCores用于光線追蹤加速,第三代RTCores的有效光線追蹤計算能力達到191TFLOPS,是上一代產(chǎn)品2.8倍。
在Ampere架構(gòu)中,第二代RTCores支持邊界交叉測試(BoxIntersectiontesting)和三角形交叉測試(TriangleIntersectiontesting),用于加速BVH遍歷和執(zhí)行射線三角交叉測試計算,雖然光線追蹤處理能力已經(jīng)比初代的Turing架構(gòu)核心更高效,但是隨著環(huán)境和物體的幾何復(fù)雜性持續(xù)增加,傳統(tǒng)的處理方式很難再以更高效率、正確反應(yīng)出的現(xiàn)實世界中的光線,尤其是光的運動準確性。
所以在第三代RTCores增加了兩個重要硬件單元:OpacityMicromapEngine與DisplacedMicro-MeshesEngine引擎。OpacityMicromapEngine,主要是用于alpha通道的加速,可以將alpha測試幾何體的光線追蹤速度提高2倍。
在傳統(tǒng)光柵渲染中,開發(fā)人員使用一些Alpha通道的素材來實現(xiàn)更高效的畫面渲染,例如Alpha通道的葉子或火焰等復(fù)雜形狀的物體。但在光線追蹤時代,這傳統(tǒng)的做法會為光線追蹤帶為不少無效的計算,例如運動性的光線多次通過一塊葉子,光線每擊中一次葉子,都會調(diào)用一次著色器來確定如何處理相交,這時就會做成嚴重的執(zhí)行成本與時間等待成本。
而OpacityMicromapEngine用于直接解析具有非不透明度光線交集的不透明度狀態(tài)
三角形。根據(jù)Alpha通道的不透明,透明與未知等三個不同的塊狀態(tài)進行處理:透明則直接忽略繼續(xù)找下一個,不透明塊則記錄并告之命中,而未知的則交給著色器來確定如何處理,這樣GPU很大部分都不需要進行著色器的調(diào)試處理,能夠?qū)崿F(xiàn)更為高效的性能。
DisplacedMicro-MeshesEngine
如果說OpacityMicromapEngine加速的是面處理,那么DisplacedMicro-MeshesEngine就是幾何曲面細節(jié)的加速器。如上圖所示,在AdaLovelace架構(gòu)中,通過1個基底三角形 位移地圖,就可以創(chuàng)建出一個高度詳細的幾何網(wǎng)格,所需要資源占用比二代RTCores更低,效率也更高。
通過NVIDIA給出的創(chuàng)建14:1珊瑚蟹例子來說事,這里我們需要需要1.7萬個微網(wǎng)格、160萬個微三角形,在AdaLovelace架構(gòu)中BVH創(chuàng)建速度可加快7.6倍,存儲空間縮小8.1倍。DisplacedMicro-MeshesEngine起到了關(guān)鍵性的作用,其將一個幾何物體根據(jù)不同細節(jié)分成密度不一的微網(wǎng)絡(luò)處理,紅色密度超高,細節(jié)處理越為復(fù)雜。相應(yīng)的低密度微網(wǎng)絡(luò)區(qū)域則可以釋放更多的資源與存儲空間,這樣DisplacedMicro-MeshesEngine就可以幫助BVH加速過程,減少構(gòu)建時間和存儲成本。
同時AdaLovelace架構(gòu)SM中新增了著色器執(zhí)行重排序(ShaderExecutionReordering,SER),這是由于光線追蹤不再只有強光或者陰影渲染處理,未來將會更多的是在光線的運動性,這樣光線就會變得越來越復(fù)雜,想要第三代RTCores與第四代TensorCores有著更高的執(zhí)行效率,那就得為他們來安排一位管家。而著色器執(zhí)行重排序(SER)就是為了能夠即時重新安排著色器負載來提高執(zhí)行效率,為光線追蹤提供2倍的加速,也能更好地利用GPU資源。不過目前仍未有實例,想實現(xiàn)這個功能,還得游戲與開發(fā)工具的支持才行。
第四代TensorCores
TensorCores是專門為執(zhí)行張量/矩陣運算而設(shè)計的專用執(zhí)行單元,這些運算是深度學(xué)習(xí)中使用的核心計算功能。第四代TensorCores新增FP8引擎,具有高達1.32petaflops的張量處理性能,超過上一代的5倍。
9DLSS 3技術(shù)講解
技術(shù)講解:DLSS 3
或者說第四代TensorCores太硬核你不會知道是啥?提升意義在哪?但是TensorCores最經(jīng)典的應(yīng)用DLSS你肯定會知道,這一次AdaLovelace架構(gòu)支持NVIDIA最新的DLSS3技術(shù)。
之前我們也聊過DLSS技術(shù),其設(shè)計之初是為了彌補光線追蹤技術(shù)后的性能損失,具體的表現(xiàn)為開啟光線追蹤技術(shù)后游戲幀數(shù)大幅度的下降,甚至很難保證游戲流暢的運行。于是DLSS使用低分辨率內(nèi)容作為輸入并運用AI技術(shù)輸出高分辨率幀,從而提升光線追蹤的性能。
在DLSS3中包含了三項技術(shù):DLSS幀生成、DLSS超分辨率(也稱為DLSS2)和NVIDIAReflex。你可以理解為DLSS3是在DLSS2的基礎(chǔ)上,新增了DLSS幀生成技術(shù);而后兩技術(shù)中,DLSS超分辨率只需要GeForceRTX顯卡都能使用上,NVIDIAReflex則是GeForce900系列以后的顯卡都用使用上。
想實現(xiàn)DLSS幀生成可不簡單,這需要配合上AdaLovelace架構(gòu)的GeForceRTX40系列顯卡才行。DLSS幀生成技術(shù)原理是:利用AI技術(shù)生成更多幀,以此提升性能。DLSS會借助GeForceRTX40系列GPU所搭載的全新光流加速器分析連續(xù)幀和運動數(shù)據(jù),進而創(chuàng)建其他高質(zhì)量幀,同時不會影響圖像質(zhì)量和響應(yīng)速度。
從Ampere架構(gòu)開始,NVIDIA顯卡就已經(jīng)支持了光流加速器,而AdaLovelace架構(gòu)的光流加速器升級到了第二代,其提供了高達300TeraOPS(TOPS),比安培架構(gòu)的初代光流加速器(OpticalFlowAcceleration,OFA)快2倍以上。為了實現(xiàn)DLSS幀生成,OFA扮演了重要的角色,其配合上新的運行?量分析算法在DLSS3技術(shù)框架內(nèi)實現(xiàn)精確和高性能的幀生成能力。
另外,由于DLSS幀生成是在GPU上作為后處理執(zhí)行的,那么即使在游戲受到CPU性能限制的時候,我們同樣能夠從中獲得更好的游戲性能提升。尤其是那種物理計算密集型的游戲或大型場景游戲,DLSS2均可以讓GeForceRTX40系列顯卡以高達兩倍于CPU可計算的性能來渲染游戲。
最后由于DLSS3是建立在DLSS2基礎(chǔ)之上的,游戲開發(fā)者可以在已支持DLSS2或NVIDIAStreamline的現(xiàn)有游戲中快速集成該功能,所以DLSS3已在游戲生態(tài)得到廣泛應(yīng)用,目前已有超過35款游戲和應(yīng)用即將支持該技術(shù)。
閱讀小亮點:NVIDIAReflex
NVIDIAReflex也是DLSS3其中的一環(huán),它可以使GPU和CPU同步,確保最佳響應(yīng)速度和低系統(tǒng)延遲。
想要實現(xiàn)端對端的最低延遲,你需要確保游戲、顯示器以及鼠標三者都同時支持并開啟了Reflex技術(shù)。
當GeForceRTX40系列顯卡和NVIDIAReflex搭配上后,直接達到1440p分辨率360FPS的體驗,這著實是性能有點強勁了。
在GTC2022大會時已經(jīng)透露將會還有4款1440p分辨率的新型G-SYNC電競顯示器將要發(fā)布,包括采用mini-LED技術(shù)的AOCAG274QGM–AGONPROMiniLED、MSIMEG271QMiniLED和ViewSonicXG272G-2KMiniLED三款顯示器刷新率均為300Hz,而最猛的是ASUSROGSwift360HzPG27AQN,刷新率直接來到了360Hz。
但唯一一個問題就在于,部分顯示器廠商認為此類產(chǎn)品受眾人群較少,會降低此類顯示器的產(chǎn)能,甚至產(chǎn)品就已經(jīng)被內(nèi)部PASS掉,所以1440p360Hz是很美好,但現(xiàn)實也是相當?shù)墓歉小?/p>
10雙NVIDIA編碼器講解
技術(shù)講解:雙NVIDIA編碼器(NVENC)
GeForceRTX40系列顯卡還有一個全新的升級,那就是雙編碼器NVENC。第八代的NVENC雙編碼器不僅支持H.264與H.265,還支持開放式視頻編碼格式AV1。
而由于AV1是一種免版稅的視頻編碼格式,上游軟件廠商與下游戲的配套端都在大力推廣此編碼格式,我們也會看到越來越多的硬件與軟件支持AV1格式,包括剪映專業(yè)版、DaVinciResolve、以及AdobePremierePro較為流行的Voukoder插件均支持,且均可通過編碼預(yù)設(shè)使用雙編碼器,這樣我們等待視頻導(dǎo)出的時間縮短將近一半。
不單是視頻制作軟件,AV1格式也將會是主播、游戲直播UP主們的新寵兒,在保證畫面最高質(zhì)量的情況下,AV1編碼器可將效率提高40%,同時顯卡的占用也更低。包括OBSStudio一一代軟件中也會增加AV1格式的支持。另外我們還能通過GeForceExperience和OBSStudio錄制高達8K60的內(nèi)容,這樣我們做游戲錄制也會變得更為輕松。
包括我們之后測試時使用的游戲內(nèi)錄視頻都是支持AV1格式,同時雙編碼器NVENC在資源占用和適配上做得越來越好。
版權(quán)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容, 請發(fā)送郵件至 舉報,一經(jīng)查實,本站將立刻刪除。