隨著RTX 30系顯卡的發(fā)布,人們?cè)陉P(guān)心性能的同時(shí),一些軟性技術(shù)的應(yīng)用和更新更受到玩家的青睞,如游戲中的光追表現(xiàn)和DLSS效果。
這兩種技術(shù)可以說(shuō)有著劃時(shí)代意義,光線追蹤可以讓我們?cè)谟螒蛑蝎@得更為真實(shí)的光線效果,讓游戲畫(huà)面不斷趨近于真實(shí)。
同時(shí)還可以節(jié)省大量游戲開(kāi)發(fā)者的時(shí)間,而DLSS效果則可以在不降低畫(huà)質(zhì)的情況下讓幀數(shù)暴漲。
在新的GeForce RTX 30系顯卡中,NVIDIA更新了RT Core和Tensor Core,并且新增了大量支持這兩項(xiàng)技術(shù)的游戲,今天筆者簡(jiǎn)單為大家簡(jiǎn)單說(shuō)明并進(jìn)行幾款游戲的實(shí)測(cè)展示。
首先介紹一下測(cè)試平臺(tái),為了能完全發(fā)揮技嘉AORUS RTX 3080 XTREME 10G顯卡的性能,我們選擇了目前桌面旗艦級(jí)CPU和主板i9-10900k和Z490主板。
RT Core及光線追蹤詳解
其實(shí),光線追蹤的概念在很早就已經(jīng)被人所提出了。光線追蹤技術(shù)其實(shí)就是將光源產(chǎn)生的光線所產(chǎn)生的折射,反射等光線變化和對(duì)陰影產(chǎn)生的反應(yīng)通過(guò)計(jì)算準(zhǔn)確的反映到畫(huà)面之中,為人們帶來(lái)百分之百的光影效果。
在此次的NVIDIA Ampere架構(gòu)中,NVIDIA官方宣布為第二代RT Core,它和第一代有什么不同呢。
首先要知道RT Core的工作原理是,著色器發(fā)出光線追蹤的請(qǐng)求,交給RT Core來(lái)處理,它將進(jìn)行兩種測(cè)試,分別為邊界交叉測(cè)試(Box Intersection testing)和三角形交叉測(cè)試(Triangle Intersection testing)。
基于BVH算法來(lái)判斷,如果是方形,那么就返回縮小范圍繼續(xù)測(cè)試,如果是三角形,則反饋結(jié)果進(jìn)行渲染。
相較于初代的Turing RTX架構(gòu),NVIDIA Ampere架構(gòu)在算力上有著成倍的增長(zhǎng),同時(shí)新的架構(gòu)翻倍了光線與三角形的相交吞吐量,RT Core達(dá)到58 RT TFLOPS,而Turing為34 RT TFLOPS。
而光線追蹤最耗時(shí)的正是求交計(jì)算,因此,要提升光線追蹤性能,主要是對(duì)兩種求交(BVH/三角形求交)進(jìn)行加速。
在Turing的RT Core中,可以每個(gè)周期完成5次BVH遍歷、4次BVH求交以及一次三角形求交,在第二代RT Core 里,NVIDIA增加了一個(gè)新的三角形位置插值模塊以及一個(gè)的額外的三角形求交模塊,這樣做的目的是為了提升諸如運(yùn)動(dòng)模糊特效時(shí)候的光線追蹤性能。
《軒轅劍7》光線追蹤演示
關(guān)于概念性的東西我們就說(shuō)這么多,相信玩家更想看到的還是光追的實(shí)際效果,首先我們來(lái)測(cè)試一下近期上線的國(guó)產(chǎn)游戲《軒轅劍7》。
在《軒轅劍7》中,我們以序章的街道場(chǎng)景來(lái)做對(duì)比,第一張圖為打開(kāi)光追后的效果,光線追蹤的效果顯而易見(jiàn)。
打開(kāi)光追后街道的燈光、陰影以及太陽(yáng)光在水面的反射都有很大改善,而游戲整體的色調(diào)也由冷變暖,更富有生活氣息。
第二組對(duì)比我們選擇了太史府門(mén)前,通過(guò)對(duì)比不難發(fā)現(xiàn),打開(kāi)光追后的效果影響了游戲整體的氣氛,第一張的燈光氛圍營(yíng)造出了回家溫馨的感覺(jué),而第二張畫(huà)面陰暗感覺(jué)馬上會(huì)有什么不好的事發(fā)生,雖然比較符合游戲背景,但整體觀感略差。
Tensor Core及DLSS詳解
我們都知道光線追蹤在游戲內(nèi)會(huì)耗費(fèi)巨大的計(jì)算資源,這也導(dǎo)致了它在20系顯卡中由于算力的因素,玩家反響并不大。而在全新的NVIDIA Ampere架構(gòu)中不但引入了第二代RT Core,還有第三代Tensor Core。
NVIDIA自Volta架構(gòu)開(kāi)始,在GPU中增加了針對(duì)深度學(xué)習(xí)加速設(shè)計(jì)的矩陣運(yùn)算單元,并稱之為T(mén)ensor Core(張量計(jì)算核心)。
在圖靈架構(gòu)里,NVIDIA引入了第二代Tensor Core,而到了RTX 30系列所采用的Ampere架構(gòu),則進(jìn)化到了第三代Tensor Core。
在第三代Tensor Core中,NVIDIA引入了稀疏化加速,可自動(dòng)識(shí)別并消除不太重要的DNN(深度神經(jīng)網(wǎng)絡(luò))權(quán)重,同時(shí)依然能保持不錯(cuò)的精度。
首先原始的密集矩陣會(huì)經(jīng)過(guò)訓(xùn)練,刪除掉稀疏矩陣,再經(jīng)過(guò)訓(xùn)練稀疏矩陣,從而實(shí)現(xiàn)稀疏優(yōu)化,進(jìn)而提高Tensor Core的性能。
在實(shí)際應(yīng)用中,深度學(xué)習(xí)技術(shù)在圖形圖像各個(gè)領(lǐng)域都有著價(jià)值巨大的應(yīng)用,而在游戲體驗(yàn)中則是被稱為深度學(xué)習(xí)超采樣的DLSS技術(shù)。最新一代的DLSS能夠使得游戲畫(huà)質(zhì)極大提升,細(xì)節(jié)和銳度媲美、甚至超越原生分辨率。
DLSS本質(zhì)是一種圖像重建算法,其加原理其實(shí)也很簡(jiǎn)單。開(kāi)啟DLSS后,游戲引擎中的諸如動(dòng)態(tài)光源、陰影的計(jì)算,封閉空間環(huán)境遮擋(SSAO)、屏幕空間反射(SSR),甚至實(shí)時(shí)光線追蹤。
都會(huì)被降低到1/2甚至1/4像素的低分辨率下運(yùn)行,GPU的負(fù)擔(dān)大幅度減輕。渲染得出的最終場(chǎng)景會(huì)通過(guò)Tensor Core結(jié)合DLSS進(jìn)行高分辨率重建,從而用較低的GPU負(fù)載獲得流暢且畫(huà)質(zhì)極佳的游戲體驗(yàn)效果。
《堡壘之夜》、《死亡擱淺》DLSS效果展示
下面我們來(lái)通過(guò)實(shí)測(cè)看一下不同游戲中開(kāi)啟DLSS后的效果,我們選擇了《堡壘之夜》和《死亡擱淺》進(jìn)行測(cè)試。
首先來(lái)看《堡壘之夜》的對(duì)比畫(huà)面,其實(shí)在游戲中DLSS的開(kāi)關(guān)幾乎不會(huì)影像畫(huà)面,但是帶來(lái)幀數(shù)的變化卻非常明顯。
第一組對(duì)比由于天色的變化略失精準(zhǔn),但打開(kāi)DLSS質(zhì)量模式后,角色衣服的褶皺及棱角更明顯。在幀數(shù)上DLSS關(guān)為78幀,DLSS質(zhì)量為115幀,幀數(shù)提升47%。
第二組對(duì)比為DLSS性能與DLSS極致性能,兩者從畫(huà)面上幾乎看不出區(qū)別,但是幀數(shù)仍然提升非常恐怖。
相較于關(guān)閉DLSS的幀數(shù),DLSS性能為129幀,提升65%;DLSS極致性能為145幀,提升85%。
145幀的成績(jī)已經(jīng)完全達(dá)到高刷新電競(jìng)顯示器的幀率要求,同時(shí)在游戲中也能更順暢,最主要的是畫(huà)質(zhì)沒(méi)有任何降低。
下面我們來(lái)看小島先生的最新游戲《死亡擱淺》,這款游戲有個(gè)特別的設(shè)計(jì)就是自帶銳化,從圖中我們也能看到,在一些細(xì)小部位,銳化的痕跡十分明顯。
在關(guān)閉DLSS的情況幀數(shù)為118,而打開(kāi)DLSS質(zhì)量模式后幀數(shù)為145,畫(huà)面經(jīng)過(guò)AI處理,消除了很多鋸齒。幀數(shù)方面,打開(kāi)DLSS質(zhì)量模式后,提升為22%。
在選擇DLSS性能和DLSS極致性能后,幀數(shù)為150幀和163幀。同樣畫(huà)面相較原生畫(huà)質(zhì)來(lái)說(shuō)將銳化效果進(jìn)一步消除,觀感更柔和。與原生畫(huà)面的幀數(shù)相比,提升分別為27%和38%。
其實(shí)和光追相比,我認(rèn)為DLSS對(duì)于玩家來(lái)說(shuō)更是終極夢(mèng)想,在畫(huà)質(zhì)不變甚至更好的情況下極大提升游戲幀數(shù),這意味著你可以花費(fèi)更少的價(jià)格體驗(yàn)到更高端顯卡的性能,同時(shí)如果你的顯卡性能夠強(qiáng)勁幀數(shù)比較富裕,還可以再開(kāi)啟光追效果,進(jìn)一步增加沉浸感。
關(guān)鍵詞: