愛伊米

次世代大作標配 光線追蹤DLSS深度剖析

隨著RTX 30系顯示卡的釋出,人們在關心效能的同時,一些軟性技術的應用和更新更受到玩家的青睞,如遊戲中的光追表現和DLSS效果。這兩種技術可以說有著劃時代意義,光線追蹤可以讓我們在遊戲中獲得更為真實的光線效果,讓遊戲畫面不斷趨近於真實,同時還可以節省大量遊戲開發者的時間,而DLSS效果則可以在不降低畫質的情況下讓幀數暴漲。

次世代大作標配 光線追蹤DLSS深度剖析

技嘉AORUS GeForce RTX 3080 XTREME 10G顯示卡

在新的GeForce RTX 30系顯示卡中,NVIDIA更新了RT Core和Tensor Core,並且新增了大量支援這兩項技術的遊戲,今天筆者簡單為大家簡單說明並進行幾款遊戲的實測展示。

次世代大作標配 光線追蹤DLSS深度剖析

首先介紹一下測試平臺,為了能完全發揮技嘉AORUS RTX 3080 XTREME 10G顯示卡的效能,我們選擇了目前桌面旗艦級CPU和主機板i9-10900k和Z490主機板。

01RT Core及光線追蹤詳解

次世代大作標配 光線追蹤DLSS深度剖析

光線追蹤的演變經歷了約半個世紀

其實,光線追蹤的概念在很早就已經被人所提出了。光線追蹤技術其實就是將光源產生的光線所產生的折射,反射等光線變化和對陰影產生的反應透過計算準確的反映到畫面之中,為人們帶來百分之百的光影效果。

次世代大作標配 光線追蹤DLSS深度剖析

光追工作原理示意

在此次的NVIDIAAmpere架構中,NVIDIA官方宣佈為第二代RT Core,它和第一代有什麼不同呢。首先要知道RT Core的工作原理是,著色器發出光線追蹤的請求,交給RT Core來處理,它將進行兩種測試,分別為邊界交叉測試(Box Intersection testing)和三角形交叉測試(Triangle Intersectiontesting)。基於BVH演算法來判斷,如果是方形,那麼就返回縮小範圍繼續測試,如果是三角形,則反饋結果進行渲染。

相較於初代的Turing RTX架構,NVIDIAAmpere架構在算力上有著成倍的增長,同時新的架構翻倍了光線與三角形的相交吞吐量,RT Core達到58 RTTFLOPS,而Turing為34RT TFLOPS。

而光線追蹤最耗時的正是求交計算,因此,要提升光線追蹤效能,主要是對兩種求交(BVH/三角形求交)進行加速。

次世代大作標配 光線追蹤DLSS深度剖析

RT Core的變化

在Turing的RT Core中,可以每個週期完成5次BVH遍歷、4次BVH求交以及一次三角形求交,在第二代RT Core 裡,NVIDIA增加了一個新的三角形位置插值模組以及一個的額外的三角形求交模組,這樣做的目的是為了提升諸如運動模糊特效時候的光線追蹤效能。

02《軒轅劍7》光線追蹤演示

關於概念性的東西我們就說這麼多,相信玩家更想看到的還是光追的實際效果,首先我們來測試一下近期上線的國產遊戲《軒轅劍7》。

次世代大作標配 光線追蹤DLSS深度剖析

次世代大作標配 光線追蹤DLSS深度剖析

《軒轅劍7》RTX開關對比(點選圖片檢視大圖)

在《軒轅劍7》中,我們以序章的街道場景來做對比,第一張圖為開啟光追後的效果,光線追蹤的效果顯而易見。開啟光追后街道的燈光、陰影以及太陽光在水面的反射都有很大改善,而遊戲整體的色調也由冷變暖,更富有生活氣息。

次世代大作標配 光線追蹤DLSS深度剖析

次世代大作標配 光線追蹤DLSS深度剖析

《軒轅劍7》RTX開關對比(點選圖片檢視大圖)

第二組對比我們選擇了太史府門前,透過對比不難發現,開啟光追後的效果影響了遊戲整體的氣氛,第一張的燈光氛圍營造出了回家溫馨的感覺,而第二張畫面陰暗感覺馬上會有什麼不好的事發生,雖然比較符合遊戲背景,但整體觀感略差。

03Tensor Core及DLSS詳解

我們都知道光線追蹤在遊戲內會耗費巨大的計算資源,這也導致了它在20系顯示卡中由於算力的因素,玩家反響並不大。而在全新的NVIDIA Ampere架構中不但引入了第二代RT Core,還有第三代Tensor Core。

NVIDIA自Volta架構開始,在GPU中增加了針對深度學習加速設計的矩陣運算單元,並稱之為Tensor Core(張量計算核心)。

次世代大作標配 光線追蹤DLSS深度剖析

稀疏深度學習

在圖靈架構裡,NVIDIA引入了第二代Tensor Core,而到了RTX 30系列所採用的Ampere架構,則進化到了第三代Tensor Core。在第三代Tensor Core中,NVIDIA引入了稀疏化加速,可自動識別並消除不太重要的DNN(深度神經網路)權重,同時依然能保持不錯的精度。

首先原始的密集矩陣會經過訓練,刪除掉稀疏矩陣,再經過訓練稀疏矩陣,從而實現稀疏最佳化,進而提高Tensor Core的效能。

在實際應用中,深度學習技術在圖形影象各個領域都有著價值巨大的應用,而在遊戲體驗中則是被稱為深度學習超取樣的DLSS技術。最新一代的DLSS能夠使得遊戲畫質極大提升,細節和銳度媲美、甚至超越原生解析度。

次世代大作標配 光線追蹤DLSS深度剖析

第三代Tensor Core的處理能力大大提升

DLSS本質是一種影象重建演算法,其加原理其實也很簡單。開啟DLSS後,遊戲引擎中的諸如動態光源、陰影的計算,封閉空間環境遮擋(SSAO)、螢幕空間反射(SSR),甚至實時光線追蹤。都會被降低到1/2甚至1/4畫素的低解析度下執行,GPU的負擔大幅度減輕。渲染得出的最終場景會透過Tensor Core結合DLSS進行高解析度重建,從而用較低的GPU負載獲得流暢且畫質極佳的遊戲體驗效果。

04《堡壘之夜》、《死亡擱淺》DLSS效果展示

下面我們來透過實測看一下不同遊戲中開啟DLSS後的效果,我們選擇了《堡壘之夜》和《死亡擱淺》進行測試。

次世代大作標配 光線追蹤DLSS深度剖析

《堡壘之夜》DLSS開關對比(點選圖片檢視大圖)

首先來看《堡壘之夜》的對比畫面,其實在遊戲中DLSS的開關幾乎不會影像畫面,但是帶來幀數的變化卻非常明顯。第一組對比由於天色的變化略失精準,但開啟DLSS質量模式後,角色衣服的褶皺及稜角更明顯。在幀數上DLSS關為78幀,DLSS質量為115幀,幀數提升47%。

次世代大作標配 光線追蹤DLSS深度剖析

《堡壘之夜》效能/極致效能對比(點選圖片檢視大圖)

第二組對比為DLSS效能與DLSS極致效能,兩者從畫面上幾乎看不出區別,但是幀數仍然提升非常恐怖。相較於關閉DLSS的幀數,DLSS效能為129幀,提升65%;DLSS極致效能為145幀,提升85%。145幀的成績已經完全達到高重新整理電競顯示器的幀率要求,同時在遊戲中也能更順暢,最主要的是畫質沒有任何降低。

次世代大作標配 光線追蹤DLSS深度剖析

《死亡擱淺》DLSS開關對比(點選圖片檢視大圖)

下面我們來看小島先生的最新遊戲《死亡擱淺》,這款遊戲有個特別的設計就是自帶銳化,從圖中我們也能看到,在一些細小部位,銳化的痕跡十分明顯。在關閉DLSS的情況幀數為118,而開啟DLSS質量模式後幀數為145,畫面經過AI處理,消除了很多鋸齒。幀數方面,開啟DLSS質量模式後,提升為22%。

次世代大作標配 光線追蹤DLSS深度剖析

效能/極致效能對比(點選圖片檢視大圖)

在選擇DLSS效能和DLSS極致效能後,幀數為150幀和163幀。同樣畫面相較原生畫質來說將銳化效果進一步消除,觀感更柔和。與原生畫面的幀數相比,提升分別為27%和38%。

其實和光追相比,我認為DLSS對於玩家來說更是終極夢想,在畫質不變甚至更好的情況下極大提升遊戲幀數,這意味著你可以花費更少的價格體驗到更高階顯示卡的效能,同時如果你的顯示卡效能夠強勁幀數比較富裕,還可以再開啟光追效果,進一步增加沉浸感。

05技嘉AORUS RTX 3080 XTREME 10G顯示卡

本次的測試所使用的是技嘉AORUS RTX 3080 XTREME 10G顯示卡,作為玩家口中的“大雕”,效能自然足夠出眾。

次世代大作標配 光線追蹤DLSS深度剖析

AORUS GeForce RTX 3080 XTREME

在外觀上這款顯示卡正面採用2個115mm和1個100mm風扇,搭配著內部風爪靜葉、進氣格柵散熱設計和正逆轉風扇,讓風壓可以完整地覆蓋到所有散熱鰭片,從而實現顯示卡內部散熱零死角。

次世代大作標配 光線追蹤DLSS深度剖析

三風扇疊加設計

與我們往常見到的風扇轉動方向有所不同,這款顯示卡採用正逆轉風扇,正逆轉氣流導向設計,可顯著減少相鄰風扇之間的亂流並提高氣流壓力。同時從圖中我們也能看到三個風扇相互交錯疊加,真正實現了零死角的難題。

次世代大作標配 光線追蹤DLSS深度剖析

技嘉AORUS RTX 3080 XTREME 10G影片輸出介面

另外在顯示卡影片介面方面,有2個HDMI 2。1+1個HDMI 2。0+3個DP的設計,總計驚人的6介面,讓AORUS RTX 3080 XTREME 10G顯示卡擁有著更強大的擴充套件性。

在效能方面,AORUS GeForce RTX 3080 XTREME突出特性便是核心頻率達到恐怖的1905MHz,其他主要引數,採用了GA102核心,三星8nm工藝,芯片面積達到了628平方毫米,擁有8704個CUDA,採用10GB GDDR6X視訊記憶體,位寬為320bit,視訊記憶體頻寬達到了760。3GB/s,光柵單元和紋理單元分別為96和272。

次世代大作標配 光線追蹤DLSS深度剖析

金屬造型的強化背板

技嘉AORUS GeForce RTX 3080 XTREME對於目前大部分3A大作在4K解析度下都能輕鬆應對,即使是號稱眾生平等的《刺客信條:奧德賽》也能在4K解析度下跑到60幀以上,對於即將上市的《賽博朋克2077》來說,燈紅酒綠的不夜城必然也需要效能更強勁的顯示卡來體驗賽博朋克的魅力。如果對於近期發售的大作比較感興趣,不妨關注一下這款技嘉AORUS GeForce RTX 3080 XTREME顯示卡。

(7567556)