NVIDIA在CES2022大展上,公開了新款卡皇GeForceRTX3090Ti。其擁有10752個(gè)流處理器,基本頻率為1560MHz,加速頻率為1860MHz,配有24GB的GDDR6X顯存,速率達(dá)到21Gbps,加上384位的顯存位寬,理論顯存帶寬超過了1TB/s,這將是GeForce顯卡歷史上首次跨過1TB/s的帶寬。
NVIDIA表示,GeForceRTX3090Ti單精度浮點(diǎn)性能為40TFLOPS,達(dá)到了目前Ampere架構(gòu)顯卡的最高水平。其TDP提高到450W,同時(shí)也是第一款采用新型PCIe5.0外接供電接口的顯卡。不過,GeForceRTX3090Ti的身上其實(shí)還有些有趣的事情,接下來我們扒開它看一下。
完全體的GA102核心現(xiàn)身完全體的GA102核心這次終于來了,它仍然沿用了從NVIDIAPascal架構(gòu)開始定下的GPC-TPC-SM層級(jí)架構(gòu),完全體的GA102核心一共具有7組完整的GPC,每組GPC包含6組TPC,每組TPC包含2組SM,所以完整的GA102核心擁有84個(gè)SM單元。
而且在Ampere架構(gòu)中,每個(gè)SM單元擁有的CUDA核心數(shù)現(xiàn)在為128個(gè),這就使得GeForceRTX3090Ti一共擁有10752個(gè)流處理器的超大規(guī)模。但是,與之前的GeForceRTX3090相比,GeForceRTX3090Ti主要只是多了些流處理器嗎?并不是這樣。
我們先來看一下GeForceRTX3090Ti與TITANRTX、GeForceRTX3090和GeForceRTX3080Ti規(guī)格參數(shù)對(duì)比:
從定位上來說,GeForceRTX3090Ti以及GeForceRTX3090都是上代TITANRTX的繼任者,上一代TITANRTX的定位是面向AI和數(shù)據(jù)科學(xué)的解決方案,不過從目前這一代來看,TITAN這個(gè)系列似乎是被砍掉了,于是GeForceRTX3090Ti以及GeForceRTX3090被錄入了GeForce陣容,但是他們的目標(biāo)群體很明確——面向8K游戲玩家及重度創(chuàng)作者,而這兩者之中,其實(shí)更加偏向于重度創(chuàng)作者用戶。
帶糾錯(cuò)碼(ECC)的24GBGDDR6X顯存如果說GeForceRTX3090定位是生產(chǎn)力工具的一個(gè)鮮明的特點(diǎn)是24GB大容量的GDDR6X顯存的話,那么GeForceRTX3090Ti在這上又漸進(jìn)了一步,那就是其顯存配置不僅容量大,而且支持ECC糾錯(cuò)碼了,這是筆者個(gè)人認(rèn)為GeForceRTX3090Ti相比GeForceRTX3090區(qū)別最大的兩個(gè)地方之一。同時(shí)這也讓GeForceRTX3090Ti看著很像設(shè)計(jì)與可視化解決方案領(lǐng)域的***卡——RTXA6000。
但是GeForceRTX3090Ti與RTXA6000各有長(zhǎng)處,RTXA6000的典型特點(diǎn)是可以配備最高達(dá)48GB的顯存容量,但是GeForceRTX3090Ti的特點(diǎn)是配備了比RTXA6000更快的顯存——GDDR6X。相對(duì)來說,設(shè)計(jì)與可視化生產(chǎn)流程更加偏重于需求大容量,而游戲需要低延遲,所以對(duì)顯存速度也有要求,越快越好,當(dāng)然,游戲的分辨率以及貼圖質(zhì)量也影響著顯存容量的需求。
所以這里我們可以看到一個(gè)GeForceRTX3090Ti一個(gè)無出其右的點(diǎn)——那就是它的顯存特點(diǎn)綜合了GDDR6X的“快”、24GB的“大”容量以及支持ECC糾錯(cuò)碼的“穩(wěn)”,可以說是一個(gè)沒有短板的多面手。
驅(qū)動(dòng)的控制面板中有顯存的ECC開關(guān),默認(rèn)是關(guān)閉的,對(duì)于創(chuàng)作軟件來說開ECC會(huì)增加穩(wěn)定性,而對(duì)于游戲用戶來說,就不用打開了,由于多了一步糾錯(cuò)碼計(jì)算,會(huì)稍微影響性能,默認(rèn)不動(dòng)就好。
頻率提升巨大上面說顯存支持ECC糾錯(cuò)碼是筆者個(gè)人認(rèn)為GeForceRTX3090Ti相比GeForceRTX3090區(qū)別最大的兩個(gè)地方之一,而第二個(gè)地方并不是更多的流處理器,而是頻率。
對(duì)于GeForceRTX3090的GA102-300和GeForceRTX3090Ti的GA102-350這樣的大核心來說,同時(shí)擁有高頻是比較難的,因?yàn)榧词箍梢愿哳l,它也會(huì)面臨功耗和發(fā)熱的難題,畢竟隨著頻率的提升,功耗與發(fā)熱是以超越線性的比例提升的,這也是為什么我們看到每一代的旗艦卡往往頻率并不是同架構(gòu)中最高的。
而這次的GeForceRTX3090Ti確實(shí)令人驚訝,它的Boost頻率達(dá)到了1860MHz,相比GeForceRTX3090的1695MHz提高了大約10%,相比較而言,流處理器單元只不過提高了不到3%而已。
顯存帶寬終于越過1TB/s大關(guān)在GeForceRTX3090身上,顯存帶寬已經(jīng)來到了936GB/s,距離1TB/s大關(guān)只差臨門一腳了,這最后一腳由誰(shuí)來實(shí)現(xiàn)呢?當(dāng)然是NVIDIA自己,于是這一次于猛獸盡頭更進(jìn)一步的GeForceRTX3090Ti終于實(shí)現(xiàn)了超越1TB/s的顯存帶寬,達(dá)到了1008GB/s,這是GeForce顯卡歷史上第一次跨過1TB/s的帶寬。
而且除了這個(gè)第一,GeForceRTX3090Ti也是第一款采用新型PCIe5.0外接供電接口的顯卡。
同樣的,基于新一代Ampere架構(gòu)的GeForceRTX3090Ti顯卡也具有這一代Ampere顯卡的一些通用特性,并且相比上一代Turing架構(gòu)有很大的進(jìn)步。
NVIDIAAmpere架構(gòu)簡(jiǎn)介GeForceRTX30系顯卡上的SM單元相比GeForceRTX20系的,最大變化是加倍了針對(duì)傳統(tǒng)計(jì)算的FP32單元、引入第二代RTCore以及第三代TensorCore。
大家都知道在Turing架構(gòu)中,NVIDIA整數(shù)型(INT32)和單精度浮點(diǎn)型(FP32)兩種不同的數(shù)據(jù)類型交給兩種不同的ALU進(jìn)行計(jì)算。不過現(xiàn)代游戲應(yīng)用中最為常見的還是FP32,因此為了提高計(jì)算效率NVIDIA在NVIDIAAmpere架構(gòu)上引入了可同時(shí)支持INT32或FP32兩種數(shù)據(jù)類型的新ALU。也就是說,現(xiàn)在有兩條不同的數(shù)據(jù)路徑,一條能夠同時(shí)處理整數(shù)或者單精度浮點(diǎn),另一條則單純處理處理單精度浮點(diǎn)計(jì)算。
負(fù)責(zé)進(jìn)行實(shí)時(shí)光線追蹤運(yùn)算的專用硬件單元RTCore在NVIDIAAmpere架構(gòu)上也更新到了第二代,最主要是增加了動(dòng)態(tài)模糊的加速運(yùn)算支持。NVIDIA在其中新加入的插值算法可以在保證動(dòng)態(tài)模糊精確性的同時(shí)提高了實(shí)時(shí)光線追蹤效率,官方表示最高可達(dá)8倍于上代的速度。另外在基礎(chǔ)的BVH計(jì)算上,第二代RTCore也可以比第一代快2倍。
TensorCore這個(gè)負(fù)責(zé)運(yùn)行AI計(jì)算的硬件單元在NVIDIAAmpere架構(gòu)上也升級(jí)到了第三代。其實(shí)之前發(fā)布的A100計(jì)算卡上已經(jīng)用上了新的第三代TensorCore,它能夠提供比第二代TensorCore高出4倍的效能,不過游戲卡上面的TensorCore進(jìn)行了一定的精簡(jiǎn),其FP16FMA計(jì)算的吞吐量只有GA100核心中的TensorCore的一半。
而第三代TensorCore帶來的更強(qiáng)勁AI運(yùn)算有些什么用呢?答案就是DLSS。隨著GeForceRTX30系顯卡一同發(fā)布的,還有DLSS的更新版-DLSS8K。顧名思義,DLSS8K就是通過深度學(xué)習(xí)技術(shù)將畫面分辨率拉伸至8K的新版DLSS,具體來說就是把1440P的畫面拉伸至4320P,像素?cái)?shù)量跨越了整整9倍。
再之后就是HDMI2.1這個(gè)備受期待的新輸出端口了。在HDMI2.1之下,顯卡可以用單線材做到8K60Hz或者4K120Hz的輸出。對(duì)于想用大尺寸電視打游戲的玩家來說是一個(gè)不錯(cuò)的福音。
華碩TUFRTX3090TiO24GGAMING顯卡外觀華碩TUFRTX3090TiO24GGAMING顯卡的外觀與這一代TUF顯卡的設(shè)計(jì)基本相同,同樣采用了金屬整流罩搭配低調(diào)的暗色花紋設(shè)計(jì),并配置有金屬背板,保護(hù)PCB的同時(shí)也可以輔助散熱。另外整流罩的表面采用了兩種工藝進(jìn)行加工,分別是磨砂工藝和拉絲工藝。
顯卡散熱器配備的是三把約10cm直徑的Axial-Tech軸流風(fēng)扇,此款風(fēng)扇采用雙滾珠軸承,扇葉末端帶有風(fēng)扇環(huán),可以形成比普通扇葉更高且更具導(dǎo)向性的風(fēng)量和風(fēng)壓,并且具有低溫自動(dòng)停轉(zhuǎn)的功能。另外值得一提的是,位于中間的風(fēng)扇在旋轉(zhuǎn)方向上與另外兩把是相反的,這樣的設(shè)計(jì)可以有效減少風(fēng)扇相互之間的氣流干擾,同樣是有利于提升散熱效果的。
華碩TUFRTX3090TiO24GGAMING顯卡的金屬背板表面采用拉絲工藝處理,厚度約為2mm,可以保護(hù)顯卡PCB不會(huì)因?yàn)橹亓Χ鴱澢捕擞羞M(jìn)行開窗,可以讓散熱風(fēng)流更好地通過,以增強(qiáng)散熱器以及背板的散熱效果。顯卡的總體長(zhǎng)度為32.4cm,高度為12.7cm,厚度為5.9cm,相當(dāng)于3槽厚度。
顯卡采用的并非是傳統(tǒng)的PCIE供電接口,而是新式PCIe5.0外接供電接口設(shè)計(jì),即16Pin供電接口。這是這張卡在外觀方面與其他GPU型號(hào)的顯卡相比非常獨(dú)特的一點(diǎn),同時(shí)為了保證與老式電源的兼容性,華碩TUFRTX3090TiO24GGAMING顯卡也提供了一條12Pin轉(zhuǎn)3個(gè)8Pin的轉(zhuǎn)接線。
由于顯卡上是16Pin供電接口,而轉(zhuǎn)接線是12Pin,用戶可能擔(dān)心用3個(gè)8Pin轉(zhuǎn)12Pin的供電線接在顯卡的16Pin供電接口上會(huì)不會(huì)有影響,這點(diǎn)其實(shí)可以放心,那個(gè)4Pin的信號(hào)接口目前是不影響的。
PCIe5.0外接供電接口的發(fā)展經(jīng)歷了一個(gè)過程,NVIDIA在GeForceRTX30系列顯卡發(fā)布的時(shí)候推出了12Pin接口,可以提供最大600W的供電,而不久前英特爾發(fā)布ATX3.0和ATX12VO2.0規(guī)范則往前推進(jìn)了一步,將接口定為16Pin,其中12Pin負(fù)責(zé)供電,另外4Pin負(fù)責(zé)信號(hào)傳輸,用于電源與PCIe5.0顯卡直接通信確定供電極限。
不過之前ATX3.0和ATX12VO2.0規(guī)范說的“新款線材接頭會(huì)標(biāo)出對(duì)應(yīng)的額定功率,分別有150W、300W、450W和600W四檔”這次還沒看到,手里的線材上面并沒有標(biāo)注功率信息。
看完了供電接口,我們?cè)倏达@示器接口方面,顯卡提供了3個(gè)DP1.4a接口和2個(gè)HDMI2.1接口,比大多數(shù)顯卡都多提供了1個(gè)HDMI2.1接口,對(duì)于用戶進(jìn)行多屏輸出的話有更好的兼容性。
顯卡的供電接口旁邊有個(gè)開關(guān),可在顯卡的雙BIOS中進(jìn)行切換,兩個(gè)BIOS分別對(duì)應(yīng)性能模式和靜音模式,筆者拿到卡的默認(rèn)狀態(tài)是性能模式,后面的測(cè)試也會(huì)在這個(gè)模式下進(jìn)行測(cè)試以反映大多數(shù)用戶的實(shí)際使用情況。
最后,另外一個(gè)在外觀方面與其他GPU型號(hào)的顯卡相比非常獨(dú)特的一點(diǎn)就是NVLink接口了。
華碩TUFRTX3090TiO24GGAMING顯卡拆解華碩TUFRTX3090TiO24GGAMING顯卡的主體散熱采用用了6根6mm直徑的熱管,使用回流焊工藝與底座以及散熱鰭片結(jié)合;鰭片則可以分成前后兩大區(qū)域,除了GPU本身外還照顧了顯卡前后的VRM供電區(qū)域,整體散熱面積非常大;底座則為純銅鍍鎳設(shè)計(jì),表面進(jìn)行了鏡面打磨,可讓散熱器表面與GPU芯片更好的接觸,以提升導(dǎo)熱效率。
并且它還有一根熱管把顯卡PCB左側(cè)的供電MosFET的熱量傳遞面積最大的那組鰭片上,而且也有通過導(dǎo)熱貼與主散熱器互聯(lián),能把熱量傳遞到主散熱器,同時(shí)底部采用一體化設(shè)計(jì),能做到一定程度的熱量均衡。
顯卡背板除了加固保護(hù)PCB的作用之外,其上面也貼有導(dǎo)熱膠,可以將顯存和供電電路的部分熱量引導(dǎo)至背板上,起到較好的輔助散熱效果。
顯卡使用的是GA102-350核心,具有GA102核心完整的規(guī)格,共有84組SM單元,一共10752個(gè)流處理器。
周圍有12顆美光的GDDR6X顯存,型號(hào)為美光的D8BZC,單顆2GB容量,32-bit位寬,12顆一共組成24GB384-bit的顯存規(guī)格。
顯存這次的變化是相比于GeForceRTX3090很重大的一點(diǎn)變化,新款2GB顆粒取代GeForceRTX3090的1GB顆粒可以讓GeForceRTX3090Ti配備的顯存顆粒數(shù)量限制在12個(gè),于是可以全部都安放在PCB正面,通過散熱器高效散熱,這簡(jiǎn)化了顯卡的設(shè)計(jì),而且降低了顯卡背面的散熱需求。
筆者至今都對(duì)之前GeForceRTX3090的背面高發(fā)熱記憶猶新,GeForceRTX3090由于背面的顯存發(fā)熱量比較大,對(duì)顯卡整體散熱設(shè)計(jì)提出了較高的要求,不少用戶也為此苦惱,而GeForceRTX3090Ti的2GB顆粒可以降低顯卡背面發(fā)熱情況。而且與GeForceRTX3090相比的話,新的顯存顆粒數(shù)據(jù)速率也提高了,從19.5Gbps提高到了21Gbps。
PCB上除了GPU和顯存外,剩余空間基本上都用于布置供電元件,GPU的左右兩側(cè)都有供電電路,一共是21相,其中18相給GPU核心供電,3相為顯存供電。供電部分的mosFET均是芯源系統(tǒng)(MPS)的MP86957,供電控制方面主要是1顆芯源系統(tǒng)(MPS)的MP2891來負(fù)責(zé)。
性能測(cè)試通過GPU-Z可以看到,華碩TUFRTX3090TiO24GGAMING顯卡的基礎(chǔ)頻率為1560MHz,Boost頻率為1920MHz,相比公版方案1860MHz的頻率OC了60MHz,顯存等效數(shù)據(jù)速率為21Gbps。
通過GPU-Z還可以看到待機(jī)狀態(tài)下風(fēng)扇轉(zhuǎn)速為零,這是由于前面說過的華碩TUFRTX3090TiO24GGAMING具有風(fēng)扇智能啟停功能。
此外,華碩TUFRTX3090TiO24GGAMING的默認(rèn)溫度上限是83攝氏度,玩家可以選擇向上解鎖到90攝氏度,功耗上限默認(rèn)為450W,玩家可以選擇向上解鎖到最大516W。
測(cè)試平臺(tái)與說明測(cè)試平臺(tái)如上表所示,主板采用的是ROGSTRIXZ690-AGAMINGWIFID4吹雪主板,內(nèi)存用兩根芝奇皇家戟DDR4-360016GB組成雙通道,其中BIOS設(shè)置方面,除了開啟XMP讓內(nèi)存運(yùn)行在3600MHz頻率上之外,同時(shí)在主板BIOS中打開ResizableBAR的支持,其他均采用默認(rèn)設(shè)置。
代表各款GPU型號(hào)的顯卡分別是:華碩TUFRTX3090TiO24GGAMING,Boost頻率1920MHz;NVIDIAGeForceRTX3090FounderEdition,Boost頻率1695MHz;訊景XFXRadeonRX6900XT海外版,Boost頻率2365MHz。
這次的電源要特別介紹一下,因?yàn)樗詭б桓?6Pin的原生線,用于適配新的GeForceRTX3090Ti顯卡,對(duì)于之前已經(jīng)購(gòu)買了雷神2代1000W及以上和雷神1代1200W及以上的用戶,可以像之前申請(qǐng)Z690的LGA1700扣具一樣在網(wǎng)上申請(qǐng),華碩就會(huì)給老的ROG雷神用戶補(bǔ)發(fā)16Pin線材。
基準(zhǔn)測(cè)試我們以3DMark作為顯卡基準(zhǔn)性能測(cè)試,測(cè)試項(xiàng)目包括FireStrike、FireStrikeExtreme、FireStrikeUltra、TimeSpy、TimeSpyExtreme以及PortRoyal六個(gè)項(xiàng)目。其中FireStrike、FireStrikeExtreme、FireStrikeUltra三個(gè)項(xiàng)目分別測(cè)試的是顯卡在DX11游戲中的1080p分辨率、2K分辨率和4K分辨率下的性能指數(shù),TimeSpy、TimeSpyExtreme兩個(gè)項(xiàng)目則是顯卡在DX12游戲中的2K分辨率和4K分辨率下的性能指數(shù),PortRoyal是測(cè)試的顯卡實(shí)時(shí)光線追蹤的性能指數(shù),具體成績(jī)見下表,表中所列成績(jī)均為3DMark顯卡單項(xiàng)的得分。
基準(zhǔn)測(cè)試方面,GeForceRTX3090Ti相比GeForceRTX3090平均提升幅度為10%,而與RadeonRX6900XT比較仍然是隨著渲染壓力不同呈現(xiàn)出不同的結(jié)果,在渲染壓力最小的FireStrike項(xiàng)目中,RadeonRX6900XT的跑分是最高的,比GeForceRTX3090Ti還要高,隨著渲染壓力越來越大,GeForceRTX3090Ti的優(yōu)勢(shì)就越來越大,到了TimeSpyExtreme項(xiàng)目已經(jīng)是GeForceRTX3090Ti呈現(xiàn)大幅領(lǐng)先,而且?guī)в泄庾返腜ortRoyal項(xiàng)目更是拉大了差距。總的來說,6個(gè)項(xiàng)目的平均值結(jié)果是GeForceRTX3090Ti相比RadeonRX6900XT平均提升幅度為7%。
4K游戲測(cè)試4K光柵化游戲測(cè)試傳統(tǒng)光柵化游戲畫面測(cè)試這部分均將游戲畫質(zhì)設(shè)置為預(yù)設(shè)里面的最高畫質(zhì)設(shè)置(《地鐵:離去》選擇Ultra畫質(zhì),《賽博朋克2077》為默認(rèn)不開啟光線追蹤的預(yù)設(shè)中最高一檔),默認(rèn)不是全屏的手動(dòng)改為全屏,默認(rèn)開啟了垂直同步的手動(dòng)關(guān)閉垂直同步,除此之外其他選項(xiàng)均為默認(rèn)設(shè)置,均采用游戲自帶的Benchmark輸出結(jié)果。
傳統(tǒng)光柵化游戲畫面測(cè)試中,GeForceRTX3090Ti相比GeForceRTX3090平均提升幅度為8.5%,在《賽博朋克2077》、《孤島驚魂6》和《戰(zhàn)爭(zhēng)機(jī)器5》中差距超過了10%,分別幀數(shù)高了12.5%、10.8%和12%。
GeForceRTX3090Ti相比RadeonRX6900XT平均提升幅度為16%,在《賽博朋克2077》、《全面戰(zhàn)爭(zhēng):三國(guó)》和《紀(jì)元1800》中差距最大,GeForceRTX3090Ti相比RadeonRX6900XT分別高了30%、24%和25%。
實(shí)時(shí)光線追蹤游戲測(cè)試光追游戲畫面測(cè)試方面,光線追蹤效果均設(shè)為“高”,由于DLSS以及FSR等分辨率拉伸技術(shù)的算法并不一樣,最后的畫面效果也不一樣,為了保持測(cè)試的準(zhǔn)確性,保證同樣的畫面結(jié)果,這些測(cè)試均不開啟DLSS以及FSR等分辨率拉伸技術(shù)。
光追游戲畫面測(cè)試方面,GeForceRTX3090Ti相比GeForceRTX3090平均提升幅度為10.6%,在《賽博朋克2077》、《光明記憶》和《邊境》中差距較大,GeForceRTX3090Ti分別幀數(shù)高了13.8%、12%和14.4%。
GeForceRTX3090Ti相比RadeonRX6900XT平均提升幅度為40%,在《賽博朋克2077》、《看門狗:軍團(tuán)》和《邊境》中差距最大,GeForceRTX3090Ti相比RadeonRX6900XT分別高了105%、65%和86%。
8K光追游戲測(cè)試這部分就沒有RadeonRX6900XT的成績(jī)了,RadeonRX6900XT即使借助FSR目前也無法勝任8K光追游戲。這部分均將游戲畫質(zhì)設(shè)置為預(yù)設(shè)里面的最高畫質(zhì)設(shè)置(《地鐵:離去》選擇Ultra畫質(zhì)),開啟光線追蹤效果至“高”(《賽博朋克2077》的預(yù)設(shè)最高畫質(zhì)已經(jīng)開啟了光線追蹤效果,這部分不再變動(dòng)),打開DLSS至超級(jí)性能模式,默認(rèn)不是全屏的手動(dòng)改為全屏,默認(rèn)開啟了垂直同步的手動(dòng)關(guān)閉垂直同步,除此之外其他選項(xiàng)均為默認(rèn)設(shè)置,均采用游戲自帶的Benchmark輸出結(jié)果。
8K光追游戲畫面測(cè)試中,GeForceRTX3090Ti相比GeForceRTX3090平均提升幅度為12%,在《賽博朋克2077》、《地鐵:離去(增強(qiáng)版)》、《光明記憶》和《古墓麗影:暗影》中差距較大,分別幀數(shù)高了12.4%、13.2%、12.8%和12.5%。
創(chuàng)作應(yīng)用體驗(yàn)GeForceRTX3090Ti適合重度創(chuàng)作者,原因主要是其大容量的顯存配置,所以這里對(duì)比的顯卡不是同樣容量的GeForceRTX3090,而是GeForceRTX3080Ti,同時(shí)由于測(cè)試的重度創(chuàng)作項(xiàng)目文件較大,需要大容量的內(nèi)存容量才能全部正確的載入,故而又加了兩根16GB內(nèi)存組成了64GB的總?cè)萘俊lender的部分由于Windows11下出現(xiàn)bug,故而是在Windows10下對(duì)比的,其他項(xiàng)目都是在Windows11下對(duì)比的。
GeForceRTX3090Ti與GeForceRTX3080Ti相比,在創(chuàng)作方面的體驗(yàn)區(qū)別還主要不是一個(gè)快一些一個(gè)慢一些的區(qū)別,而是面對(duì)一些大的項(xiàng)目的時(shí)候,直接一個(gè)是可以正常工作,而另一個(gè)則會(huì)因?yàn)轱@存容量不夠出現(xiàn)項(xiàng)目無法繼續(xù)進(jìn)行、或者直接程序報(bào)錯(cuò)的情況,對(duì)于創(chuàng)作流程影響很大。
Blender在Blender里面,這次測(cè)試的素材加載之后,由于顯存不夠用,GeForceRTX3080Ti在執(zhí)行渲染的時(shí)候直接報(bào)錯(cuò),提示顯存不夠。
而GeForceRTX3090/3090Ti則可以正常完成工作流程。
Davinci在Davinci中,本次測(cè)試的是一個(gè)8KREDRAW素材,在為素材添加了一些效果之后,GeForceRTX3080Ti已經(jīng)不能正確的播放,顯存占用慢慢變高直至溢出掉后清空,然后軟件會(huì)提示顯存不足而報(bào)錯(cuò)。
而GeForceRTX3090/3090Ti則可以在同樣的效果設(shè)置下正常完成播放預(yù)覽。
OctaneRenderOctaneRender的情況也和前面差不多,GeForceRTX3080Ti在渲染的過程中出現(xiàn)橙色的“OCC”提醒,即顯卡的顯存不足,渲染調(diào)用了內(nèi)存作為臨時(shí)存儲(chǔ)。可以看到GeForceRTX3080Ti的顯存占用到8.7GB顯存,還向內(nèi)存借了6.9GB。
而GeForceRTX3090/3090Ti則很輕松,大約18.5GB的項(xiàng)目數(shù)據(jù)全部可以放在顯存中,這也導(dǎo)致它渲染起來特別的快。
可以看到由于顯存不足導(dǎo)致渲染時(shí)間天壤之別,GeForceRTX3080Ti總共用了479秒,差不多8分鐘才渲染完成。而GeForceRTX3090Ti只需要15秒就完成。
功耗測(cè)試通過我們手中的PCAT套件,可以分別精確地測(cè)量顯卡PCI-E、外接電源接口瓦特?cái)?shù),顯卡最大功耗在3DMarkTimeSpy壓力測(cè)試中獲得,待機(jī)功耗則是在進(jìn)入系統(tǒng)后記錄1分鐘取平均值。
統(tǒng)計(jì)功耗測(cè)試的結(jié)果算出,這張華碩TUFRTX3090TiO24GGAMING的整卡待機(jī)功耗平均為32.4W,滿載功耗平均為448.2W,峰值功耗到過472W。對(duì)于這樣級(jí)別的顯卡功耗來說,電源的話如果平臺(tái)其他部件的功耗不高那么可以850W的電源來帶動(dòng),如果其他部件的功耗也較高建議至少1000W的電源起步。
溫度測(cè)試我們的GPU散熱測(cè)試均在裸機(jī)狀態(tài)(如果安裝在機(jī)箱內(nèi),GPU溫度會(huì)高出5℃左右)下進(jìn)行測(cè)試,測(cè)試環(huán)境溫度約為21.1℃。待機(jī)溫度是開機(jī)以后記錄10分鐘,滿載溫度則是完成3DMarkTimeSpy壓力測(cè)試后記錄下,數(shù)據(jù)通過GPU-Z的LogtoFile功能記錄,以下為溫度測(cè)試曲線。
這張華碩TUFRTX3090TiO24GGAMING具有風(fēng)扇待機(jī)停轉(zhuǎn)的功能,所以待機(jī)狀態(tài)下全靠被動(dòng)散熱。經(jīng)過十分鐘的待機(jī)測(cè)試,從開始的37.6攝氏度上升到42.4攝氏度左右,10分鐘待機(jī)過程中最熱點(diǎn)溫度則是最低是開始的46.3攝氏度,偏后段是50.8攝氏度。
滿載狀態(tài)下,最高溫度出現(xiàn)在風(fēng)扇剛啟動(dòng)之前的瞬間,達(dá)到了72.5攝氏度,隨著主動(dòng)散熱開始,溫度就被控制住了,穩(wěn)定后該卡最高溫度僅僅才只有65.3℃,關(guān)注最熱點(diǎn)溫度的話,穩(wěn)定后也最高才75.7攝氏度,屬于非常好的滿載溫度表現(xiàn)了。
超頻測(cè)試將功耗上限和溫度上限解鎖到最高之后,經(jīng)過多番手動(dòng)超頻嘗試,GeForceRTX3090Ti最終在核心頻率+150MHz,GDDR6X顯存數(shù)據(jù)速率+2Gbps下完成超頻。這個(gè)狀態(tài)下,這張華碩TUFRTX3090TiO24GGAMING能順利通過3DMark的TimeSpyExtreme項(xiàng)目測(cè)試并且分?jǐn)?shù)最高,此時(shí)這張卡的Boost頻率為2070MHz,顯存等效頻率為23Gbps。這張華碩TUFRTX3090TiO24GGAMING在超頻狀態(tài)下運(yùn)行3DMarkTimeSpyExtreme項(xiàng)目的GPU得分與默頻狀態(tài)下GPU得分的對(duì)比如下表所示。
在這個(gè)幅度之下,華碩這張GeForceRTX3090TiO24GGAMING在TimeSpyExtreme中的顯卡得分為11994分,比默頻時(shí)高8.1%左右,對(duì)于卡皇級(jí)別的大核心來說,很恐怖了。
總結(jié)總的來說,GeForceRTX3090Ti的定位大體與之前的GeForceRTX3090差不多,面向8K游戲玩家及重度創(chuàng)作者,不過GeForceRTX3090Ti全方位超越GeForceRTX3090,相當(dāng)于就是將目前頂級(jí)的消費(fèi)級(jí)顯卡再向上推進(jìn)了一步,給了目前消費(fèi)者對(duì)于最頂級(jí)的GPU的一個(gè)新選擇。
而對(duì)于4K及以下分辨率的游戲環(huán)境來說,其實(shí)最推薦的還是GeForceRTX3080Ti,GeForceRTX3080Ti已經(jīng)可以滿足4K下頂級(jí)的游戲體驗(yàn),并且就價(jià)格來說,也是相當(dāng)合適的,GeForceRTX3080Ti整張卡的各方面設(shè)計(jì)也是面向游戲設(shè)計(jì)的。對(duì)于GeForceRTX3090Ti,相對(duì)來說還是推薦創(chuàng)作用途,只不過它也提供很好的游戲性能,但是用于創(chuàng)作用途的話,它的價(jià)值發(fā)揮的更大,顯存帶糾錯(cuò)碼(ECC)的特性也可以發(fā)揮出來。
顯卡迷你天梯榜(完整顯卡天梯榜)
GeForceRTX3090Ti的450W功耗也是不可忽視的點(diǎn),不過這個(gè)功耗也是頻率大幅度提升的結(jié)果,由此也帶來強(qiáng)大的性能提升。綜合來說,對(duì)于一張售價(jià)幾乎1.5萬(wàn)元起步的顯卡來說,它注定是少數(shù)人的囊中之物,而且就邊際效用來說,對(duì)于游戲玩家也完全不如GeForceRTX3080Ti更合適。總的來說,這張卡看起來展示意味很重。
結(jié)合最近英特爾的銳炫A系列移動(dòng)端獨(dú)顯以及AMD或許將不久后要推出RadeonRX6x50XT系列顯卡,而NVIDIA后面的新顯卡發(fā)布估計(jì)就是要等到下一代的GeForceRTX40系列再見面了,這中間很長(zhǎng)一段時(shí)間顯卡市場(chǎng)的焦點(diǎn)可能會(huì)落在英特爾和AMD身上,故而筆者認(rèn)為這次GeForceRTX3090Ti的推出是NVIDIA想傳遞出一個(gè)信息,那就是——在顯卡領(lǐng)域,即使我暫時(shí)“隱市”,你們也不要忘記還有如此一座難以逾越的高山存在。
最后,有點(diǎn)意思的是,從目前的環(huán)境來看,GeForceRTX3090Ti或許是最近兩年來最有可能用戶能在首發(fā)日前后就能以建議零售價(jià)買到的顯卡產(chǎn)品。目前筆者從華碩得到的消息是其TUF系列的GeForceRTX3090Ti顯卡如果是公版頻率的話,那么售價(jià)就是建議零售價(jià)的14999元,如果是TUF系列的OC版顯卡,售價(jià)稍高一點(diǎn)為15499元(也就是本次測(cè)試的這張顯卡),更高端的STRIX系列則是16499元。
并且,華碩表示價(jià)格會(huì)被鎖定,不會(huì)再漲價(jià),對(duì)于用戶來說這可能是最近兩年關(guān)于顯卡價(jià)格聽到的最好的消息了,沒有之一。