-
NVIDIA RTX 2080/RTX 2080 Ti首發(fā)評(píng)測(cè):感受12年來(lái)GPU最大革命
關(guān)鍵字: 游戲顯卡本文來(lái)自:驅(qū)動(dòng)之家
一、前言:NVIDIA革命性跨越 顯卡又熱鬧起來(lái)了
作為GPU顯卡行業(yè)的領(lǐng)頭羊,NVIDIA的新產(chǎn)品發(fā)布節(jié)奏多年來(lái)一直非常穩(wěn),而且每一代都有極大的創(chuàng)新和提升(完全不知牙膏味兒),產(chǎn)品線布局十分豐富,生態(tài)系統(tǒng)合作也是有著厚實(shí)的積累相當(dāng)完備。
在顯卡的江湖里,NVIDIA雖然說(shuō)不上呼風(fēng)喚雨,但始終也都是首屈一指的,GeForce更是幾乎已經(jīng)成了游戲卡的代名詞。
2017年5月,我們迎來(lái)了Pascal帕斯卡架構(gòu)的GeForce GTX 10系列,不過(guò)當(dāng)時(shí)恐怕誰(shuí)都不會(huì)想到,帕斯卡家族的命會(huì)這么長(zhǎng),而新一代讓我們苦苦等待了這么久。
最近幾代產(chǎn)品,NVIDIA都會(huì)選擇當(dāng)年的3-6月份春天或春夏之交來(lái)發(fā)布,一般在3月份的GTC圖形技術(shù)大會(huì)上首次披露,但今年非常特殊,一直拖到了9月份,比往年晚了幾乎半年。
更令人稱奇的是,NVIDIA這一次保密工作做的極好,直到發(fā)布前,我們都不知道新卡的架構(gòu)是Volta伏特、Ampere安培還是Turing圖靈,也不知道新卡的命名是GTX 10系列還是GTX 20系列,結(jié)果最終是RTX 20系列。
出現(xiàn)這種局面,最主要的原因是這一代從架構(gòu)技術(shù)到產(chǎn)品體系都發(fā)生了翻天覆地的變化,而研發(fā)全新一代架構(gòu)、完善全新技術(shù)特性,都是需要花費(fèi)無(wú)數(shù)精力、金錢和時(shí)間的(想想AMD Zen憋了多久才出來(lái)再想想Intel酷睿老本吃了多少年)。
按照NVIDIA的說(shuō)法,早在10年前就在設(shè)計(jì)和研發(fā)圖靈架構(gòu)了(當(dāng)然當(dāng)時(shí)應(yīng)該沒這個(gè)代號(hào)),主要是光線追蹤方面,因?yàn)樵诖酥?,光線追蹤只能用于影視渲染,誰(shuí)也不敢想象它能在游戲里實(shí)時(shí)呈現(xiàn)。
最終,NVIDIA創(chuàng)造奇跡,為PC游戲帶來(lái)了實(shí)時(shí)光線追蹤(即便是有條件的),也難怪黃仁勛驕傲地宣稱圖靈架構(gòu)是2006年引入CUDA統(tǒng)一著色核心以來(lái)最大的革命。
而另一方面不得不面對(duì)的一個(gè)現(xiàn)實(shí)就是,顯卡市場(chǎng)已經(jīng)沉悶太久了,尤其是在電競(jìng)火熱朝的形勢(shì)下,顯卡卻遲遲沒有跟上。
作為市面上僅有的兩大GPU巨頭之一,AMD近些年全力投入Zen CPU架構(gòu),雖然碩果累累,但也導(dǎo)致GPU方面進(jìn)展緩慢,Polaris北極星架構(gòu)的RX 400/500系列只能在中低端市場(chǎng)混,Vega織女星架構(gòu)的RX Vega系列在高端市場(chǎng)又不具備足夠的競(jìng)爭(zhēng)力。
這種形勢(shì)下,對(duì)手很容易懈怠,反正沒什么壓力,但幸運(yùn)的是,NVIDIA并沒有任性擠牙膏,反而奉上了一道更美味的大餐:全新架構(gòu)、實(shí)時(shí)光線追蹤、AI人工智能、GDDR6顯存等都讓人激動(dòng)不已,而且第一次首發(fā)就奉上了三款新卡。
長(zhǎng)久的等待終于值了,整個(gè)顯卡市場(chǎng)也再次熱鬧紛呈起來(lái)。
接下來(lái),我們就會(huì)探析一下這個(gè)革命性的Turing架構(gòu),以及全新的RTX 2080 Ti、RTX 2080兩款高端型號(hào)到底表現(xiàn)如何。
二、架構(gòu)解析之全新內(nèi)核體系
既然是一個(gè)全新設(shè)計(jì)的架構(gòu),我們就要好好看一看這個(gè)以計(jì)算機(jī)科學(xué)之父、人工智能之父艾倫·麥席森·圖靈(Alan Mathison Turing)命名的Turing圖靈新架構(gòu)到底有哪些過(guò)人之處,不過(guò)硬件架構(gòu)總是伴隨各種高深晦澀的技術(shù)名詞、技術(shù)原理,即便專業(yè)人士也得好好研究才行,所以這里我們僅從高級(jí)層面,介紹一下新架構(gòu)的大致設(shè)計(jì)、技術(shù)概況,以及能帶來(lái)的實(shí)際好處。
在以往,NVIDIA為專業(yè)級(jí)計(jì)算卡、消費(fèi)級(jí)游戲卡設(shè)計(jì)的都是統(tǒng)一架構(gòu),只是具體內(nèi)部模塊布局、技術(shù)支持、核心大小不同。好處是可以統(tǒng)一開發(fā),降低成本,壞處是缺乏針對(duì)性,技術(shù)資源要么浪費(fèi)要么不夠。
這一次,NVIDIA選擇了分而治之。針對(duì)高性能計(jì)算、圖形渲染、人工智能、深度學(xué)習(xí)等專業(yè)應(yīng)用的是Volta伏特架構(gòu),目前只有一個(gè)超大核心GV100,是迄今為止GPU歷史上最大的核心,臺(tái)積電12nm工藝制造,集成多達(dá)210億個(gè)晶體管,核心面積達(dá)815平方毫米,妥妥的怪物級(jí)核彈。
而針對(duì)游戲顯卡的就是Turing圖靈架構(gòu),也是臺(tái)積電12nm(有說(shuō)法稱最初計(jì)劃使用三星10nm),其中最大的核心TU102集成189億個(gè)晶體管,核心面積754平方毫米,是僅次于GV100的史上第二大GPU核心。
相比上代Pascal帕斯卡家族的大核心GP102,它的晶體管數(shù)量增加了55%,面積則增大了60%,甚至是次級(jí)新核心TU104都超越了GF102,擁有136億個(gè)晶體管、545平方毫米面積。
新架構(gòu)核心之所以如此龐大,除了CUDA核心規(guī)模繼續(xù)增大、升級(jí)Shading著色渲染之外,更關(guān)鍵的是RT Core光線追蹤核心、Tensor Core人工智能核心的加入,這也是新架構(gòu)革命性變化的根本支撐。
擁有全新著色性能的SM CUDA核心陣列、支持高達(dá)每秒100億條光線計(jì)算的RT光線追蹤核心、為實(shí)時(shí)游戲畫面導(dǎo)入AI人工智能加速的Tensor核心,三者就構(gòu)成了圖靈架構(gòu)的三大支柱,各自有不同分工又互相協(xié)作,共同實(shí)現(xiàn)新的游戲渲染畫面。
同時(shí),NVIDIA強(qiáng)調(diào)新架構(gòu)的單個(gè)CUDA核心著色渲染性能是帕斯卡架構(gòu)的1.5倍,第一次可以在4K分辨率、HDR開啟的情況下,提供流暢的游戲體驗(yàn),真正開啟4K時(shí)代。
按照NVIDIA的說(shuō)法,RTX 2080就能基本實(shí)現(xiàn)4K分辨率下60FPS的游戲幀率,RTX 2080 Ti更是能夠達(dá)到70-80FPS。當(dāng)然具體還要看游戲需求,以及游戲設(shè)置,特別是某些高要求的技術(shù)特性,光線追蹤打開后別說(shuō)4K了,就連1080p就比較吃力。
圖靈架構(gòu)的基本組成單元之一還是CUDA核心與SM流處理器陣列,這也是2006年的G80以來(lái)NVIDIA GPU的基石。
事實(shí)上,圖靈架構(gòu)的SM陣列也融合了伏特架構(gòu)的不少特性,相比帕斯卡架構(gòu)差別還是挺大的,比如每一組TPC里的SM陣列由一個(gè)增至兩個(gè),同時(shí)SM內(nèi)部的組成方式也截然不同。
帕斯卡架構(gòu)每個(gè)SM陣列集成128個(gè)FP32浮點(diǎn)單元,圖靈架構(gòu)則改成了2個(gè)FP64雙精度浮點(diǎn)單元、64個(gè)FP32單精度浮點(diǎn)單元、64個(gè)INT32整數(shù)單元、8個(gè)Tensor核心、一個(gè)RT核心。支持浮點(diǎn)和整數(shù)并發(fā)操作,并有新的執(zhí)行數(shù)據(jù)路徑,類似伏特架構(gòu)匯總的獨(dú)立線程調(diào)度。
按照NVIDIA的統(tǒng)計(jì),每執(zhí)行100個(gè)浮點(diǎn)指令,平均會(huì)有36個(gè)整數(shù)指令,兩種指令可以并發(fā)執(zhí)行。
如此一來(lái),帕斯卡架構(gòu)的整數(shù)和浮點(diǎn)計(jì)算就可以分配得更加均衡,并與新的Tensor、RT核心相配合,更合理、高效地完成各種負(fù)載。
整體而言,圖靈核心的CUDA陣列可以每秒執(zhí)行14萬(wàn)億次FP32浮點(diǎn)操作、14萬(wàn)億次INT32整數(shù)操作。
緩存架構(gòu)也徹底變化,由兩個(gè)載入/存儲(chǔ)單元牽頭,一級(jí)緩存和共享緩存整合在一起,而且容量靈活可變,可以是64KB+32KB,也可以是32KB+64KB,大大降低了延遲,帶寬也翻了一番。
二級(jí)緩存容量則從3MB翻倍到6MB。
NVIDIA宣稱,新架構(gòu)每個(gè)CUDA核心的著色渲染性能比上代平均提升50%,部分游戲可達(dá)70%左右,VRMark虛擬現(xiàn)實(shí)測(cè)試成績(jī)甚至翻了一番還多。
當(dāng)然這只是基礎(chǔ)理論上的數(shù)字,實(shí)際性能還要看其他部分和整體指標(biāo)。
圖靈架構(gòu)還首發(fā)搭配新一代GDDR6顯存,目前業(yè)界最快,等效頻率高達(dá)14GHz,搭配352-bit位寬可以帶來(lái)616GB/s的驚人帶寬,相比于GTX 1080 Ti在位寬不變的情況下提升了27%,也比用了2048-bit HBM2高帶寬顯存的AMD RX Vega 64高了27%。
而且關(guān)鍵是,GDDR6的成本比HBM2低得多。
另外,NVIDIA還對(duì)新顯存進(jìn)行了各種優(yōu)化,信號(hào)竄擾降低了40%,更利于運(yùn)行穩(wěn)定和進(jìn)一步超頻。
三、架構(gòu)解析之RT核心、光線追蹤
圖靈架構(gòu)和RTX 20系列的最大亮點(diǎn)和賣點(diǎn)當(dāng)然是——游戲?qū)崟r(shí)光線追蹤!
從第一顆GPU NVIDIA GeForce 256誕生至今已經(jīng)整整19年,GPU規(guī)模和技術(shù)越來(lái)越發(fā)達(dá),但是最底層的圖形渲染技術(shù)其實(shí)幾乎一成不變,始終都是光柵化渲染,通過(guò)計(jì)算三角形和多邊形來(lái)獲得畫面輸出,好處是資源消耗容易控制,壞處就是距離真實(shí)畫面相差甚遠(yuǎn),甚至永遠(yuǎn)不可能接近。
光線追蹤(Ray Tracing)技術(shù)則堪稱圖形界的“圣杯”,簡(jiǎn)單地說(shuō)就是在圖形渲染過(guò)程中實(shí)時(shí)跟蹤物體和環(huán)境的光線,準(zhǔn)確進(jìn)行光線反射和折射、全局照明、物理陰影的繪制,可以帶來(lái)近乎百分之百真實(shí)的渲染畫面,尤其是光影效果。
光線追蹤技術(shù)其實(shí)并不新鮮,1969年的時(shí)候在IBM工作的Arthur Appel就提出了這種概念,當(dāng)時(shí)叫做Ray Casting,距今已經(jīng)整整半個(gè)世紀(jì)。
1979年,Turner Whitted研究出了遞歸光線追蹤算法(Recursive RayTracing Algorithm)。
1984年,Carpenter等人發(fā)表了一篇關(guān)于分布式光線追蹤的論文《Distributed RayTracing》,影響甚廣。
但是,光線追蹤的算法非常簡(jiǎn)單,稍有計(jì)算機(jī)圖形只是的人都能理解,關(guān)鍵在于如何優(yōu)化提高效率,因?yàn)樗枰挠?jì)算量太過(guò)龐大,想想要實(shí)時(shí)計(jì)算場(chǎng)景中無(wú)數(shù)光線每時(shí)每刻的各種傳播,那是多么恐怖,以前的GPU根本無(wú)力承擔(dān)實(shí)時(shí)計(jì)算。
因此直到2006年迪士尼的《汽車總動(dòng)員》(Cars),影視行業(yè)才開始使用光線追蹤渲染,如今大多數(shù)的照片級(jí)渲染系統(tǒng)多時(shí)基于光線追蹤的,但背后都是超大規(guī)模的計(jì)算機(jī)群在吃撐,一幀畫面往往都要渲染幾個(gè)小時(shí)。
雖然大家都在努力,但就在一個(gè)月前,如果說(shuō)普通顯卡可以在游戲里實(shí)現(xiàn)光線追蹤(盡管是有條件的),相信絕大多數(shù)人都不會(huì)相信,但是NVIDIA的圖靈做到了。
NVIDIA在圖靈架構(gòu)中集成了最多72個(gè)RT Core核心,每個(gè)SM單元一個(gè),專門用來(lái)服務(wù)光線追蹤運(yùn)算,等于一個(gè)特殊的專用單元,由硬件加速取代軟件模擬,效率自然要比CUDA這種通用單元高很多,就像GPU做并行計(jì)算比CPU強(qiáng)得多。
簡(jiǎn)單來(lái)說(shuō),圖靈架構(gòu)的光線追蹤運(yùn)算步驟是這樣的:著色器單元首先發(fā)出光線探測(cè)請(qǐng)求,RT Core核心就開始完全接管下邊的工作,并分為兩個(gè)過(guò)程,其中包圍盒求交評(píng)估單元(Box Intersection Evaluators)進(jìn)行包圍盒的獲取和解碼,并進(jìn)行求交測(cè)試,得到子包圍盒或者三角形。
如果是子包圍盒,就返回重新執(zhí)行,重復(fù)剛才的步驟。如果是三角形,那就交給三角形求交評(píng)估單元(Triangle Intersection Evaluators),做下一步的求交測(cè)試,直到得到最終結(jié)果并輸出給著色器,進(jìn)行最終渲染。
看懵了對(duì)吧?懵了就對(duì)了……
整個(gè)光線追蹤計(jì)算過(guò)程中,運(yùn)用的主要是BVH算法,也就是Bounding Volume Hierarchy Traversal,層次包圍盒遍歷的意思。
比如渲染對(duì)象是一只兔子,要幾算一條光線和兔子本身的交互,就把兔子所在空間劃分成N個(gè)包圍盒,計(jì)算光線和哪一個(gè)包圍盒相交,是的話就再把這個(gè)包圍盒繼續(xù)劃分成N個(gè)更小的包圍盒,再次計(jì)算相交,如此反復(fù),一直找到和光線相交的三角形所在的包圍盒,再對(duì)這個(gè)三角形進(jìn)行最終的渲染。
BVH算法可以大大減少計(jì)算每一條光線最近相交點(diǎn)所需要遍歷的三角形數(shù)量,而且只需要進(jìn)行一次就能給所有光線使用,大大提高了執(zhí)行效率。
除了硬件方面的工作,軟件方面既有NVIDIA自己的OptiX光線追蹤引擎、GameWorks SDK光線追蹤模塊,也有微軟的DirectX 12 Ray-Tracing(DXR) API、Windows ML中間件,后者會(huì)在即將發(fā)布的Windows 10 2018年秋季更新版中正式提供。
性能方面,RTX 2080 Ti在精簡(jiǎn)了四個(gè)只有68個(gè)RT核心的情況下,每秒鐘可以計(jì)算超過(guò)100億條光線,大約等于100TFlops(每秒1000億次浮點(diǎn)運(yùn)算)。
而上代GTX 1080 Ti雖然也能執(zhí)行光線追蹤,但因?yàn)闆]有專用單元和算法,效率只有RTX 2080 Ti的大約十分之一,不足以實(shí)時(shí)用于游戲。
接下來(lái)欣賞欣賞NVIDIA RTX光線追蹤的效果和對(duì)比:
↑↑↑官方DEMO
↑↑↑官方DEMO
目前支持NVIDIA光線追蹤技術(shù)的游戲有11款(和首發(fā)時(shí)相比沒變),分別是:
- 《神力科莎》 (Assetto Corsa Competizione)
- 《原子之心》 (Atomic Heart)
- 《戰(zhàn)地5》 (Battlefield V)
- 《控制》 (Control)
- 《應(yīng)征入伍》 (Enlisted)
- 《逆水寒》 (Justice
- 《劍網(wǎng)3》 (JX3)
- 《機(jī)甲戰(zhàn)士5:雇傭兵》(MechWarrior 5:Mercenaries)
- 《地鐵:離去》
- 《Project DH》
- 《古墓麗影:暗影》(Shadow of the Tomb Raider)
不過(guò),RTX 20系列上市初期,可以玩的光線追蹤游戲暫時(shí)還是零,比如《古墓麗影:暗影》首發(fā)不支持得后期打補(bǔ)丁,《戰(zhàn)地5》則跳票了。
四、架構(gòu)解析之Tensor核心、AI加速
NVIDIA在伏特架構(gòu)上引入了全新的專用處理模塊Tensor Core,也就是張量計(jì)算核心,重點(diǎn)用來(lái)支持深度學(xué)習(xí)、高性能計(jì)算(也是晶體管大戶)。
圖靈架構(gòu)則是在游戲卡上引入Tensor Core,同時(shí)針對(duì)游戲圖形應(yīng)用做了大量的調(diào)整優(yōu)化,尤其是浮點(diǎn)精度方面。
Tensor的意思是張量,不同于我們常見的標(biāo)量(零維)、矢量(一維)、矩陣(三維),擁有三維或者更高維度,簡(jiǎn)單地說(shuō)就是一個(gè)數(shù)據(jù)容器,可以包含多個(gè)維度的數(shù)據(jù)。
現(xiàn)在火熱的深度學(xué)習(xí),就運(yùn)用了超大規(guī)模的數(shù)據(jù)運(yùn)算,其中就經(jīng)常會(huì)用到矩陣融合乘加(FMA)運(yùn)算,Tensor核心就是為這種矩陣數(shù)學(xué)運(yùn)算專門服務(wù)的。
它可以對(duì)兩個(gè)4×4 FP16浮點(diǎn)矩陣進(jìn)行相乘操作,然后將結(jié)果加入到另一個(gè)4×4 FP16/FP32浮點(diǎn)矩陣中,最終輸出新的4×4 FP16/FP32矩陣,這叫做混合精度數(shù)學(xué)運(yùn)算,因?yàn)檩斎刖仃囀前刖?,結(jié)果則可以達(dá)到全精度。
每個(gè)時(shí)鐘周期內(nèi),圖靈架構(gòu)的Tensor核心可以執(zhí)行64個(gè)FMA運(yùn)算,從而大大加速矩陣運(yùn)算,可用于新的神經(jīng)實(shí)時(shí)圖形渲染、深度學(xué)習(xí)訓(xùn)練和推理。
圖靈架構(gòu)每個(gè)SM陣列里有8個(gè)Tenor核心,總計(jì)576個(gè),完整支持114TFlops FP16浮點(diǎn)運(yùn)算(每秒114萬(wàn)億次),同時(shí)支持228TOPS INT8、455TOPS INT4整數(shù)運(yùn)算(每秒228億次、455億次),后者是伏特架構(gòu)里沒有的。
NVIDIA把看起來(lái)高深莫測(cè)的Tensor核心放到游戲卡里,顯然不是做專業(yè)運(yùn)算的,其深度學(xué)習(xí)能力也是為游戲服務(wù)的,結(jié)合新的神經(jīng)圖形框架(Neural Graphics Framework),簡(jiǎn)稱NGX,可以在游戲中實(shí)現(xiàn)DLSS深度學(xué)習(xí)超采樣抗鋸齒、AI Super Rez超級(jí)分辨率、AI Slow-Mo慢動(dòng)作、AI InPainting等等。
這些計(jì)算繁瑣、資源消耗巨大的操作,在以往也可以實(shí)現(xiàn),但會(huì)付出很大的代價(jià),效果也不盡如人意,如今有了新的Tensor核心,就可以建立屬于GPU核心自己的DNN深度神經(jīng)網(wǎng)絡(luò),將AI融入游戲。
NVIDIA已經(jīng)向游戲引擎開放NGX API,將其融入其中,實(shí)現(xiàn)底層加速。
另外和很多AI應(yīng)用類似,NVIDIA GeForce Experience軟件的作用也非常重要,它會(huì)自動(dòng)匹配顯卡型號(hào),從云端訓(xùn)練的AI模型哪里下載相應(yīng)的NGX軟件包,并定期更新,達(dá)到越用越好、甚至是因人而異的效果。
AI Super Rez:有點(diǎn)類似高清視頻中常見的Up Scaling,但是引入了人工智能和深度學(xué)習(xí)之后,可以實(shí)現(xiàn)近乎“無(wú)損放大”,原來(lái)的畫面分辨率放大2倍、4倍乃至8倍,仍然清晰銳利。
AI Slow-Mo:超級(jí)慢動(dòng)作我們并不陌生,現(xiàn)在不少高端手機(jī)都支持240FPS、480FPS乃至是960FPS的慢動(dòng)作視頻錄制。圖靈架構(gòu)可以對(duì)普通的30FPS視頻進(jìn)行智能插幀運(yùn)算,得到240FPS/480FPS的慢動(dòng)作視頻,也就是說(shuō)你不需要專門的高幀率攝像頭,就可以獲得很流暢的慢動(dòng)作視頻。
AI InPainting:可以抹掉畫面中不需要的內(nèi)容,也可以智能補(bǔ)全缺失的內(nèi)容,完全超越PS摳圖的存在。它同樣來(lái)自現(xiàn)實(shí)中大量真實(shí)世界圖片的訓(xùn)練推理。
其實(shí),慢動(dòng)作和修圖這兩項(xiàng)在之前就曾有相關(guān)報(bào)道,顯然NVIDIA在硬件、算法兩個(gè)方面都實(shí)現(xiàn)了真正的突破。
接下來(lái)就是重中之重的DLSS(深度學(xué)習(xí)超采樣抗鋸齒)。
我們知道,傳統(tǒng)的光柵化圖形渲染畫面會(huì)存在各總各樣的鋸齒(狗牙),所以GPU廠商都會(huì)在后期處理中加入各種各樣的AA抗鋸齒技術(shù),但傳統(tǒng)抗鋸齒都是由GPU去運(yùn)算的,效果參差不齊不說(shuō),最關(guān)鍵的是會(huì)消耗大量的GPU資源,開啟之后讓游戲卡得沒法玩再正常不過(guò)了。
DLSS深度采樣超采樣抗鋸齒則和傳統(tǒng)抗鋸齒技術(shù)走了一條完全不同的路,它是在NVIDIA超級(jí)計(jì)算機(jī)上進(jìn)行訓(xùn)練,而不再消耗GPU本身的資源。
針對(duì)每一款游戲,NVIDIA會(huì)在運(yùn)算建立對(duì)應(yīng)的訓(xùn)練神經(jīng)網(wǎng)絡(luò),收集大量的64x超采樣數(shù)據(jù),對(duì)像素點(diǎn)進(jìn)行64次偏移著色合成輸出,理論上可以獲得近乎完美的抗鋸齒平滑效果,同時(shí)還會(huì)對(duì)比和普通渲染畫面之間的差異,調(diào)整網(wǎng)絡(luò)權(quán)重,反復(fù)迭代,最后獲得更合理的抗鋸齒畫面效果,還可以避免傳統(tǒng)TAA時(shí)間抗鋸齒的運(yùn)動(dòng)模糊等問題。
云端訓(xùn)練完成后,NVIDIA會(huì)通過(guò)GFE軟件將成果分發(fā)給玩家,再用到游戲中,而且隨著游戲運(yùn)行得越多,DLSS學(xué)習(xí)效果就會(huì)越來(lái)越優(yōu)化,甚至每個(gè)玩家都可以得到屬于自己的不同效果。
當(dāng)然了,這也意味著NVIDIA需要和每一款游戲或者每一個(gè)游戲引擎合作,去進(jìn)行專門的優(yōu)化,還是相當(dāng)費(fèi)時(shí)費(fèi)力的,不過(guò)考慮到NVIDIA在游戲行業(yè)廣泛深入的合作關(guān)系,這方面倒不必?fù)?dān)心。
尤其是隨著合作優(yōu)化的深入,NVIDIA完全可以建立起屬于自己的技術(shù)壁壘,讓對(duì)手望塵莫及,進(jìn)一步帶動(dòng)大量玩家忠實(shí)地跟隨NVIDIA。
以上是2x DLSS與傳統(tǒng)64x SSAA、TAA的效果對(duì)比,大家可以仔細(xì)觀察一下畫面細(xì)節(jié)。
更神奇的是,DLSS因?yàn)榛静恍枰腉PU本地資源,因此可以大大釋放GPU性能,讓其專心渲染游戲,提升性能。
比如根據(jù)官方數(shù)據(jù),Epic的《滲透者》(Infiltrator)游戲里,4K分辨率下1080 Ti開啟TAA平均幀率還不到40FPS,2080 Ti開啟DLSS則能達(dá)到80FPS,提升了整整一倍!
游戲支持方面也不是啥大事兒,RTX 20系列發(fā)布之初就有16款游戲(PPT上寫錯(cuò)了),現(xiàn)在產(chǎn)品還沒完全上市就已經(jīng)增加到25款。
首發(fā)名單如下:
- 《方舟:生存進(jìn)化》 (Ark: Survival Evolved)
- 《原子之心》 (Atomic Heart)
- 《無(wú)畏》 (Dauntless)
- 《最終幻想XV》 (Final Fantasy XV)
- 《破碎之地》 (Fractured Lands)
- 《殺手2》 (Hitman 2)
- 《奈恩群島》 (Islands of Nyne)
- 《逆水寒》 (Justice)
- 《劍網(wǎng)3》 (JX3)
- 《機(jī)甲戰(zhàn)士5:雇傭兵》 (Mechwarrior 5:Mercenaries)
- 《絕地求生》 (PlayerUnknown’s Battlegrounds)
- 《遺跡:灰燼重生》 (Remnant: From the Ashes)
- 《英雄薩姆4:星球惡棍》 (Serious Sam 4: PlanetBadass)
- 《古墓麗影:暗影》 (Shadow of the Tomb Raider)
- 《鍛造競(jìng)技場(chǎng)》 (The Forge Arena)
- 《少數(shù)幸運(yùn)兒》 (We Happy Few)
新增名單如下:
- 《暗黑血統(tǒng)3》(Darksiders 3)
- 《飛向月球:財(cái)富》(Deliver Us The Moon: Fortuna)
- 《恐懼群狼》(Fear the Wolves)
- 《地獄之刃:塞娜的獻(xiàn)祭》(Hellblade: Senua"s Sacrifice)
- 《KINETIK》
- 《前哨零》(Outpost Zero)
- 《超殺:行尸走肉》(Overkill"s The Walking Dead)
- 《人渣》(SCUM)
- 《風(fēng)暴奇兵》(Stormdivers)
這其中有5款游戲同時(shí)支持RTX光線追蹤和DLSS抗鋸齒技術(shù),分別是《原子之心》、《逆水寒》、《劍網(wǎng)3》、《機(jī)甲戰(zhàn)士5:雇傭兵》、《古墓麗影:暗影》。
五、架構(gòu)解析之混合渲染、高級(jí)渲染
圖靈架構(gòu)雖然引入了光線追蹤,但以現(xiàn)在的GPU性能和技術(shù)算法,顯然不可能把一切渲染都交給光線追蹤,傳統(tǒng)的光柵化渲染依然離不開。
因此,NVIDIA在圖靈架構(gòu)中使用了混合渲染流水線(Hybrid Rendering Pipeline),針對(duì)不同的工作負(fù)載,分別使用CUDA核心的光柵化渲染、RT核心的光線追蹤渲染、Tensor核心的計(jì)算渲染的一種或多種組合,獲得渲染效率的最大化。
當(dāng)然,在典型的混合渲染場(chǎng)景中,也不會(huì)同時(shí)用到三種渲染方式。
如此一來(lái),如何衡量圖靈架構(gòu)的實(shí)際渲染性能,就不能用以前的算法了,而要根據(jù)三種不同渲染方式的使用程度,綜合衡量。
以上就是在一個(gè)典型的渲染場(chǎng)景中,圖靈架構(gòu)各種渲染方式的組合分配,一般而言80%的時(shí)間里使用著色器FP32浮點(diǎn)運(yùn)算、28%的時(shí)間使用著色器INT32整數(shù)運(yùn)算、40%的時(shí)間使用RT核心、20%的時(shí)間使用Tensor核心FP16浮點(diǎn)運(yùn)算。
比如RTX 2080 Ti,結(jié)合各個(gè)部分的峰值性能,最終的渲染性能就是:
14×80%+14×28%+100×40%+114×20=78T
NVIDIA給這個(gè)結(jié)果自定義了一個(gè)單位RTX-OPS,可以理解為RTX顯卡每秒鐘能執(zhí)行的操作數(shù),也就是780億次。
與此同時(shí),圖靈架構(gòu)也引入了多種新的、更高級(jí)的Shade著色渲染技術(shù)。
比如網(wǎng)格渲染(Mesh Shading):面對(duì)復(fù)雜、龐大的場(chǎng)景,不再逐一計(jì)算每一個(gè)物體的所有細(xì)節(jié),而是由GPU靈活地計(jì)算物體細(xì)節(jié)等級(jí)(LOD),踢出被遮擋的,削弱低細(xì)節(jié)的,再加上傳統(tǒng)曲面細(xì)分技術(shù),更高效地生成真正實(shí)際需要的三角形,也能大大減輕CPU負(fù)擔(dān)。
可變率著色(Variable Rate Shading):按照?qǐng)鼍爸械膹?fù)雜度不同,分區(qū)域動(dòng)態(tài)調(diào)整著色速率和資源分配,目的還是減輕GPU負(fù)擔(dān)、避免不必要的資源浪費(fèi),最終有利于提升渲染效率、游戲幀率。
可變速率著色渲染有很多應(yīng)用場(chǎng)景,比如內(nèi)容適應(yīng)性著色(CAS)、動(dòng)作適應(yīng)性著色(MAS)、注視點(diǎn)選擇性渲染、鏡頭優(yōu)化。就不一一展開了。
多角度渲染(Multi-View Rendering)、紋理空間共享(Texture-Space Sharing)。
六、架構(gòu)解析之視頻、輸出、虛擬現(xiàn)實(shí)
作為顯卡,除了渲染游戲畫面,視頻編解碼、輸出顯示也都是基礎(chǔ)工作,而且這一代NVIDIA還特別強(qiáng)化了對(duì)VR虛擬現(xiàn)實(shí)的支持。
視頻編解碼方面,圖靈架構(gòu)已經(jīng)可以支持到VP9、HEVC(H.265) 10/12-bit HDR解碼,同時(shí)支持HEVC 8K30fps HDR實(shí)時(shí)編碼,可節(jié)省最多25%的碼率,H.264格式也能節(jié)省最多15%。
根據(jù)NVIDIA的數(shù)據(jù),圖靈架構(gòu)顯卡進(jìn)行視頻直播時(shí),1080p分辨率6K碼率、4K分辨率40K碼率的CPU占用率都只需1%,掉幀率也是1%甚至為零,相比之下帕斯卡就有點(diǎn)慘不忍睹了。
顯示輸出方面,圖靈新卡既有標(biāo)準(zhǔn)的HDMI 2.0b、DisplayPort 1.4接口(同時(shí)為DP 1.4a標(biāo)準(zhǔn)做好了準(zhǔn)備),分別最高支持4K/60fps、8K/60fps輸出,并首次加入了USB Type-C接口,用于支持VirtualLink VR應(yīng)用,提供三個(gè)HBR3 DisplayPort通道,支持USB 3.1 Gen.2 10Gbps速度,可提供最大27W供電能力。
VirtualLink標(biāo)準(zhǔn)由NVIDIA、Oculus、Valve、AMD/微軟牽頭制定,是一種開放的行業(yè)標(biāo)準(zhǔn),可以讓VR頭顯擺脫多條線纜的束縛,只需一根高速USB Type-C數(shù)據(jù)線,就可以直連顯卡和VR頭顯。
而現(xiàn)在的VR頭顯,比如說(shuō)HTC Vive,就需要HDMI、USB、電源三條線。
七、架構(gòu)解析之三大核心與型號(hào)
圖靈家族除了架構(gòu)本身變化巨大,產(chǎn)品體系也和以往明顯不同,首發(fā)一口氣就是三款型號(hào)RTX 2080 Ti、RTX 2080、RTX 2070,而且分別對(duì)應(yīng)三個(gè)不同核心TU102、TU104、TUF106,而以往的x80、x70都是共享一個(gè)核心。
具體原因不詳,可能是新一代核心太大,x70直接用大核心閹割成本比較高,還不如再造一個(gè)省錢的小核心。
這就是最頂級(jí)的TU102核心,186億個(gè)晶體管、754平方毫米面積確實(shí)不是蓋的。
內(nèi)有4608個(gè)CUDA核心,分為6組GPC、36組TPC、72組SM陣列(每組SM 64個(gè)CUDA核心),同時(shí)有72個(gè)RT核心、576個(gè)Tensor核心、288個(gè)紋理單元、96個(gè)ROP光柵單元,二級(jí)緩存容量6MB,寄存器文件18MB,352-bit位寬。
不過(guò),RTX 2080 Ti并未完全使用整個(gè)TU102核心,而是有所精簡(jiǎn),僅提供4352個(gè)CUDA核心(68組SM陣列),RT核心則減少為68個(gè),Tensor核心544個(gè)。
目前只有Quadro RTX 8000用了完整的TUF102,可能是初期良品率不足,優(yōu)先供給專業(yè)市場(chǎng),也可能是功耗和發(fā)熱在游戲卡上不好控制,還有可能是留一手……
RTX 2080 Ti的核心頻率基礎(chǔ)為1350MHz,加速頻率FE公版做到了1635MHz,非公版則規(guī)定是1545MHz,當(dāng)然大家可以隨意超頻。
顯存搭配11GB GDDR6,等效頻率14GHz,帶寬為616GB/s,整卡功耗260W。
TU104核心,136億個(gè)晶體管,545平方毫米,比帕斯卡家族的大核心GP102都要大一圈。
它集成了3072個(gè)CUDA核心,劃分為6組GPC、24組TPC、48組SM(每組SM還是64個(gè)),同時(shí)有192個(gè)紋理單元、64個(gè)ROP單元、384個(gè)Tensor核心、48個(gè)RT核心,二級(jí)緩存容量4MB,寄存器文件12MB,顯存位寬256-bit。
RTX 2080同樣沒有用滿TU104核心,而是精簡(jiǎn)了兩組SM,提供2944個(gè)CUDA核心、368個(gè)Tensor核心、46個(gè)RT核心,完整版還是在專業(yè)卡上,Quadro RTX 6000。
RTX 2080核心基礎(chǔ)頻率1515MHz,加速頻率非公版1710MHz,公版直接定在1800MHz,搭配8GB GDDR6顯存,等效頻率14GHz,帶寬448GB/s,功耗225W。
它的渲染性能為60 TRX-OPS,相比于RTX 2080 Ti削弱了23%,光線追蹤性能8 GigaRays/s(每秒80億條光線),削弱了20%。
TU106核心,108億個(gè)晶體管,445平方毫米,相比GP102也只是分別差了10%、6%,更可見圖靈家族的龐大。
TU106核心內(nèi)建2304個(gè)CUDA核心,分為3組GPC、18組TPC、36組SM陣列(每組繼續(xù)64個(gè)),同時(shí)有144個(gè)紋理單元、64個(gè)ROP單元、288個(gè)Tensor核心、36個(gè)RT核心,二級(jí)緩存容量4MB,寄存器文件9MB,顯存位寬還是256-bit。
RTX 2070終于用了完整的TU106核心,核心頻率基礎(chǔ)1410MHz,加速公版1710MHz、非公版1620MHz,繼續(xù)搭配8GB 14GHz GDDR6顯存,功耗185W。
渲染性能45 RTX-OPS,相比于RTX 2080 Ti、RTX 2080分別低了25%、42%,光線追蹤性能6 GigaRays/s(每秒60億條光線),分別低了25%、40%。
圖靈家族三大核心與帕斯卡家族大核心GP102對(duì)比。
八、圖賞:16相數(shù)字供電 售價(jià)萬(wàn)元的雙風(fēng)扇“煤氣灶”
以下是RTX 2080的圖賞。
RTX 2080包裝盒。
公版RTX 2080顯卡的外觀有了巨大的變化,放棄以往的渦輪散熱,轉(zhuǎn)而采用開放式雙風(fēng)扇設(shè)計(jì),加上銀色金屬機(jī)身,看起來(lái)像極了“煤氣灶”。
一塊巨大的全覆銀色金屬背板,背板厚度達(dá)到了3mm,具有良好的散熱效果。
8+6PIN的供電輸入,可以提供350W的輸入功率。
拋棄了傳統(tǒng)的SLI接口,采用了第二代NVIDIA NVLink高速互聯(lián)方案,能提供100GB/s的雙向帶寬,并且大大降低了延遲。
拆開扇熱器后的PCB本體,RTX 2080采用TU104核心,擁有136億晶體管,幾乎2倍于GTX 1080。顯存采用的美光GDDR6 14000MHz,單顆1GB,一共8顆組成256Bit 8GB,顯存帶寬達(dá)到了448GB/s。
供電部分采用了8相核心+2相顯存的供電方案,并且大量采用了高端的鉭電容,供電規(guī)模及用料遠(yuǎn)遠(yuǎn)超過(guò)了公版的GTX 1080(6+1相供電)。
散熱器可以完美貼合PCB上每一個(gè)發(fā)熱的元件,顯卡不會(huì)出現(xiàn)某個(gè)部分溫度過(guò)高的情況。
以下是RTX 2080 Ti的圖賞。
RTX 2080 Ti包裝盒。
與RTX 2080一樣,RTX 2080 Ti也同樣舍棄了以往的渦輪散熱,轉(zhuǎn)而采用雙風(fēng)扇設(shè)計(jì),看上去就是一個(gè)價(jià)值一萬(wàn)元的煤氣灶。
銀色全覆金屬背板,也同樣是和RTX 2080一樣,沒有什么區(qū)別。
雙8Pin供電,最高能提供400W的收入功率。
同樣采用了第二代NVIDIA NVLink高速互聯(lián)方案。
RTX 2080 Ti采用TU102核心,擁有189億晶體管。
顯存采用的美光GDDR6 14000MHz,單顆1GB,一共11顆組成352Bit 11GB,顯存帶寬達(dá)到了616GB/s。
供電部分則采用了14+2一共16相供電方案,頂級(jí)非公都很難達(dá)到這樣的規(guī)模,看來(lái)售價(jià)萬(wàn)元的顯卡在用料方面果真是舍得下本錢。
散熱器可以完美貼合PCB上每一個(gè)發(fā)熱的元件,顯卡不會(huì)出現(xiàn)某個(gè)部分溫度過(guò)高的情況。
九、測(cè)試平臺(tái):5.2GHz的i7-8086K助陣
測(cè)試平臺(tái)如下:
i7-8086K基于八代酷睿Coffee Lake構(gòu)架,14++納米工藝制造,核心面積約150平方毫米,擁有六個(gè)核心十二線程,睿頻加速達(dá)5GHz,這是Intel史上第一顆默認(rèn)能跑到5GHz頻率的處理器。
為了盡可能的發(fā)揮RTX 2080 Ti強(qiáng)大的性能,我們將此U超頻到了5.2GHz。
主板選用了華碩MAXIMUS X HERO,擁有高達(dá)10相超合金數(shù)字供電,超頻能力在Z370主板中屬于頂級(jí)水準(zhǔn)。BIOS已經(jīng)更新到最新版本。
內(nèi)存使用了影馳HOF II DDR4-4000 8GBx2套裝,測(cè)試中開啟XMP保持4000MHz頻率,時(shí)序?yàn)?9-25-25-45 CR2。
機(jī)箱采用了酷冷至尊頂級(jí)的H500M型號(hào),其前置雙200mm風(fēng)扇以及大面積的金屬散熱孔 能夠?qū)C(jī)箱內(nèi)部熱量快速排出,有效降低電源和硬盤的溫度。
機(jī)箱背部的金屬鎧甲將背線打理的井井有條,看上去十分干凈。
我們采用的顯示器是LG 38UC99,其支持的最高分辨率為3840X1600,測(cè)試中的4K分辨率就是指的這個(gè)。
測(cè)試平臺(tái)使用的是酷冷至尊MasterWatt Maker1200W鈦金電源。
MasterWatt Maker1200W是目前頂級(jí)的雙路電源,轉(zhuǎn)換效率高達(dá)93%。雙路12V輸出,每路限流50A即600W的功率。
MasterWatt Maker 1200采用的是全模組設(shè)計(jì),不同功能的模組接口都有著不同的外形,以防止玩家誤接。
為了壓制5.2GHz的i7-8086K,散熱器采用了九州風(fēng)神頂級(jí)的船長(zhǎng)280一體水冷散熱器。
十、1080P分辨率測(cè)試:RTX 2080碾壓帕斯卡全系 處理器開始瓶頸
Turing的核心構(gòu)架完全不同于以往的產(chǎn)品,從Kepler到Maxwell到再到Pascal,每一個(gè)CUDA核心都就是由FP32單元構(gòu)成。
而Turing每一個(gè)CUDA核心除了有一個(gè)FP32的單精度浮點(diǎn)單元之外,還有一個(gè)INT32的單精度整數(shù)單元。每8個(gè)CUDA單元搭配一個(gè)TENSOR核心,64個(gè)CUDA CORE+8個(gè)TENSOR CORE再加上一個(gè)RT CORE構(gòu)成一組SM(其實(shí)每一組SM中還有2個(gè)FP64雙精度浮點(diǎn)單元,只是下圖并沒有標(biāo)示出來(lái))。
根據(jù)NVIDIA的說(shuō)法,INT32可以為每個(gè)CUDA核心帶來(lái)36%的性能提升,再加上L1緩存帶寬的成本增加以及降低延遲,最終圖靈每個(gè)CUDA核心相比帕斯卡能有50%的性能提升。
圖靈是否真如所說(shuō)還是需要具體的測(cè)試來(lái)驗(yàn)證,下面正式進(jìn)入游戲測(cè)試環(huán)節(jié)。
3DMark Time Spy
RTX 2080 Ti的3DMark Time Spy跑分,圖形分?jǐn)?shù)達(dá)到了13597。
RTX 2080 Ti的3DMark Time Spy跑分,圖形分?jǐn)?shù)達(dá)到了10838。
在3DMark Time Spy 測(cè)試中,RTX 2080超越了GTX 1080 Ti,領(lǐng)先了20%,相比GTX 1080的7393分則提升了46%之多。
RTX 2080 Ti比GTX 1080 Ti提升了52%。
3DMark Fire Strike Extreme
2013年誕生的3DMark Fire Strike其實(shí)已經(jīng)不再適合充當(dāng)最新顯卡的測(cè)試工具,RTX 2080的表現(xiàn)不如GTX 1080 Ti,有500分的差距,但是依然比GTX 1080強(qiáng)了22%。
RTX 2080 Ti相比GTX 1080 Ti有21%的提升。
GTA V
《GTA V》于2015年登陸PC平臺(tái),全平臺(tái)的銷量已經(jīng)超過(guò)了1億,算是 10年來(lái)最成功的單機(jī)大作,現(xiàn)在依然人氣不減。
畫質(zhì)手動(dòng)調(diào)為最高特效,開啟MSAA 2X以及NVIDIA TXAA,分辨率為1920x1080,顯存占用3422M。
1080P分辨率下受制于CPU性能瓶頸,RTX 2080 Ti與RTX 2080幀數(shù)幾乎一樣,比GTX 1080 Ti只有2幀的優(yōu)勢(shì),比起GTX 1080多了14幀。
刺客信條:起源
《刺客信條:起源》是由育碧制作并發(fā)行的《刺客信條》系列歷史上規(guī)模最大的一個(gè)。本作采用開放地圖沙盒玩法,游戲幾乎呈現(xiàn)了整個(gè)古埃及王國(guó),畫質(zhì)與風(fēng)景無(wú)人能出其右。
測(cè)試時(shí)開啟極高畫質(zhì),分辨率為1920x1080。
圖靈的2張顯卡都過(guò)了100幀,RTX 2080領(lǐng)先GTX 1080 19幀,RTX 2080 Ti比GTX 1080 Ti多了12幀。
孤島驚魂5
《孤島驚魂5》是一款由育碧(Ubisoft)制作的第一人稱射擊游戲。 已于2018年3月正式發(fā)售。
在《孤島驚魂5》中,RTX 2080 Ti領(lǐng)先GTX 1080 Ti 23幀,RTX 2080領(lǐng)先GTX 1080 29幀。
古墓麗影10
畫面設(shè)置為1920*1080 FXAA、DX12+默認(rèn)非常高畫質(zhì)。
RTX 2080 Ti幀數(shù)達(dá)到了204,領(lǐng)先GTX 1080 Ti 32幀這是第一次有顯卡能在1080P最高畫質(zhì)下跑出200+的幀數(shù)。RTX 2080領(lǐng)先GTX 1080 33幀。
GTX980Ti在進(jìn)行此項(xiàng)測(cè)試時(shí),若選擇DX12模式,幀數(shù)會(huì)爆降30%,因此該卡是以DX11進(jìn)行的游戲測(cè)試。
古墓麗影11
《古墓麗影:暗影》是一款由Eidos Montreal工作室制作的動(dòng)作冒險(xiǎn)游戲, 本作是重啟版《古墓麗影》的系列第三作,已于2018年9月15日正式發(fā)售。該游戲在后續(xù)的補(bǔ)丁中將提供對(duì)RTX系列顯卡DLSS與光線追蹤技術(shù)的支持。
畫面設(shè)置為1920*1080 FXAA、DX12+手動(dòng)最高畫質(zhì)。
在古墓麗影11中,RTX 2080 Ti跑出了142幀,領(lǐng)先GTX 1080 Ti 37幀。
RTX 2080也有117幀,比GTX 1080多了28幀。
絕地求生
雖然已經(jīng)發(fā)售了一年之久,《絕地求生》依然是目前最火的PC游戲,經(jīng)過(guò)藍(lán)洞工作室數(shù)次優(yōu)化,現(xiàn)在已經(jīng)能較為完善的支持6核處理器。
由于本游戲沒有提供測(cè)試程序,我們選在訓(xùn)練場(chǎng)中選擇了一塊無(wú)人場(chǎng)地,反復(fù)進(jìn)行多次幀率測(cè)試,確認(rèn)每次得到的結(jié)果差距都在2%以內(nèi)。
受制與CPU性能,RTX 2080 Ti與RTX 2080跑出了同樣的幀數(shù),相比GTX 1080 Ti領(lǐng)先了27幀,比起GTX 1080則有45幀的優(yōu)勢(shì)。
奇點(diǎn)灰燼
《奇點(diǎn)灰燼》作為一個(gè)老牌的PC游戲測(cè)試項(xiàng)目,目前已經(jīng)優(yōu)化了8核處理器支持,它對(duì)處理器和顯卡的要求都非常高。
測(cè)試時(shí)選擇Crazy畫質(zhì)、DX12模式、分辨率為1080P
在《奇點(diǎn)灰燼》中,RTX 2080 Ti跑出了107幀,領(lǐng)先GTX 1080 Ti 25幀。
RTX 2080也有98幀,領(lǐng)先GTX 1080 Ti 15幀,領(lǐng)先GTX 1080 29幀。
突出重圍:人類分裂
《殺出重圍:人類分裂》是Square Enix為PS4開發(fā)的次世代FPS類游戲,該游戲是目前所測(cè)試游戲中對(duì)顯卡性能要求最高的一款。測(cè)試時(shí)畫質(zhì)
RTX 2080 Ti幀率為93FPS,領(lǐng)先GTX 1080 Ti 25幀。RTX1080則有74幀,領(lǐng)先GTX 1080 Ti 19幀。
生化危機(jī)7
《生化危機(jī)7》是卡普空制作的生存恐怖類游戲《生化危機(jī)》數(shù)字編號(hào)系列第八部,有著全新的恐怖求生體驗(yàn),玩家的視覺切換為更駭人的虛擬實(shí)境“隔離視覺”模式,寫實(shí)感提升至一個(gè)全新的境界。
游戲的測(cè)試方式為從開局下車地點(diǎn)走到教堂門口,記錄20秒幀數(shù)。
《生化危機(jī)7》對(duì)CPU性能沒有太高要求,在1080P最高畫質(zhì)下,RTX 2080 Ti跑出了了313FPS的高幀率,領(lǐng)先GTX 1080 Ti將近60%。
RTX 2080也有243幀,領(lǐng)先GTX 1080 Ti 44幀,比GTX 1080快了83幀,領(lǐng)先幅度也有51%。
守望先鋒
《守望先鋒》暴雪娛樂第一次涉足FPS領(lǐng)域的作品,2016年曾經(jīng)火爆全球,影響力一度超過(guò)了LOL,即便是現(xiàn)在仍然還有相當(dāng)數(shù)量的玩家活躍在游戲中。
由于游戲沒有提供測(cè)試程序,我們選在訓(xùn)練關(guān)卡中從出生地一直向前奔跑,用Fraps記錄20秒幀數(shù)。測(cè)試時(shí)打開10
《守望先鋒》游戲內(nèi)鎖死了300幀,所以RTX 2080 Ti最多也就能跑到300幀,相比GTX 1080 Ti領(lǐng)先了55幀。
RTX 2080成績(jī)?yōu)?66幀,領(lǐng)先GTX 1080 同樣也是55幀。
文明6
《文明6》是由Firaxis Games開發(fā),2K Games負(fù)責(zé)發(fā)行的策略類游戲,該游戲是游戲設(shè)計(jì)師席德·梅爾創(chuàng)作的《文明》系列的第6部。
測(cè)試時(shí)選擇最高畫質(zhì),并將所有材質(zhì)分辨率調(diào)到最高。
《文明6》也是一款幾度需求CPU性能的游戲,除了RX580之外,其他幾款顯卡幀數(shù)都沒有多少區(qū)別,最強(qiáng)的RTX 2080 Ti也就比GTX980Ti快了不到5%。
巫師3
《巫師3》為《巫師》系列游戲作品的第三部,也是杰洛特冒險(xiǎn)的終曲。層獲第33屆金搖桿獎(jiǎng)最佳劇情、最佳視覺設(shè)計(jì)、最佳游戲時(shí)刻,更獲得IGN 2015年度最佳游戲。
游戲內(nèi)沒有提供測(cè)試程序,測(cè)試場(chǎng)景選在一處山坡,測(cè)試時(shí)騎馬直線奔馳,用Fraps記錄20秒幀數(shù)。
在1080P最高畫質(zhì)下,RTX 2080 Ti跑出了136幀,比GTX 1080 Ti快了43幀,領(lǐng)先幅度將近50%。
RTX 2080幀數(shù)為115FPS,領(lǐng)先GTX 1080 32幀。
中土世界:戰(zhàn)爭(zhēng)之影
在最高畫質(zhì)下,同時(shí)開啟TAA抗鋸齒,RTX 2080 Ti能跑出160FPS的幀率,領(lǐng)先GTX 1080 Ti 39幀,
十一、2K分辨率測(cè)試:新構(gòu)架威力進(jìn)一步顯現(xiàn)
本來(lái)2K分辨率測(cè)試不在計(jì)劃之內(nèi),考慮到現(xiàn)在不少玩家都用上2K分辨率顯示器,臨時(shí)決定將此分辨率加入測(cè)試。
由于文明6過(guò)于依賴CPU性能,GTX1070以上的顯卡都沒有跑出差距,在計(jì)算性能百分比時(shí)并未加入此游戲的數(shù)據(jù)。
在2560x1440分辨率下,RTX 2080 Ti的性能稍稍得以施展,相比GTX 1080領(lǐng)先幅度達(dá)到了65%,比GTX 1080 Ti則快了39%。
RTX 2080相比GTX 1080領(lǐng)先幅度達(dá)到了34%,比GTX 1080 Ti也快了13%。
麥克斯韋年代的旗艦GTX980Ti與GTX1070的性能進(jìn)一步拉開,僅能達(dá)到后者86%的性能。
AMD這邊的期間顯卡VEGA64稍強(qiáng)與GTX 1080,領(lǐng)先幅度為4%。
十二、4K分辨率測(cè)試:高端顯卡的主戰(zhàn)場(chǎng) 圖靈得以一展雄風(fēng)
對(duì)于RTX 2080 Ti這種級(jí)別的顯卡而言,只有4K分辨率才能真正榨干它全部的性能,低分辨下進(jìn)行測(cè)試時(shí),由于CPU本身在渲染建模方面無(wú)法跑出太高幀率,RTX 2080 Ti的性能難以完全發(fā)揮。
我們采用的顯示器是LG 38UC99,測(cè)試的分辨率為3860X1600,與標(biāo)準(zhǔn)的3840X2160的4K分辨率有些許差異。測(cè)試時(shí)的畫面設(shè)置與1080P相同,不再一一贅述。
3DMark Time Spy Extreme
RTX 2080的3DMark Time Spy Extreme跑分,圖形分?jǐn)?shù)達(dá)到了4949。
RTX 2080 Ti的3DMark Time Spy Extreme跑分,圖形分?jǐn)?shù)達(dá)到了6364。
在3DMark Time Spy 測(cè)試中RTX 2080跑分比GTX 1080 Ti高了761分,領(lǐng)先幅度為18%,相比GTX 1080的3314分則提升了50%之多。
RTX 2080 Ti比GTX 1080 Ti提升了52%。
3DMark Fire Strike Ultra
3DMark Fire Strike Ultra現(xiàn)在無(wú)法反應(yīng)圖靈的真實(shí)性能,此項(xiàng)測(cè)試中RTX 2080要落后GTX 1080 Ti大概4%,但在所有其他的游戲測(cè)試中,RTX 2080都是大幅度領(lǐng)先GTX 1080 Ti,無(wú)一例外。
RTX 2080 Ti在此項(xiàng)測(cè)試中的得分為7907,領(lǐng)先GTX 1080 Ti 1446分。
RTX 2080得分則為6225,領(lǐng)先GTX 1080 1035分。
最終幻想15
《最終幻想15》是Square Enix史上最昂貴的游戲開發(fā)項(xiàng)目,歷時(shí)10年的開發(fā)周期。本作是《最終幻想》系列中最接近 “水晶的神話”的核心內(nèi)容的一部,向玩家呈現(xiàn)了一個(gè)廣大而又開放的世界
RTX 2080 Ti跑出了5579的分?jǐn)?shù),領(lǐng)先GTX 1080 Ti 1691分,領(lǐng)先幅度為43%。
RTX 2080的分?jǐn)?shù)為4528,領(lǐng)先GTX 1080 Ti 16%,相比GTX 1080領(lǐng)先幅度有32%。
GTA V
RTX 2080 Ti幀率為85FPS,領(lǐng)先GTX 1080 Ti 20幀。
RTX 2080幀率為73FPS,領(lǐng)先GTX 1080 18幀。
刺客信條:起源
在《刺客信條:起源》測(cè)試中,RTX 2080 Ti幀率為75FPS,領(lǐng)先GTX 1080 Ti 幀。
RTX 2080幀率為62FPS,領(lǐng)先GTX 1080 16幀。
孤島驚魂5
在《孤島驚魂5》測(cè)試中,RTX 2080 Ti跑出了92FPS的幀率,領(lǐng)先GTX 1080 Ti 24幀。
RTX 2080幀率為72FPS,領(lǐng)先GTX 1080 Ti 16幀。
古墓麗影10
RTX 2080 Ti的幀率為103FPS,領(lǐng)先GTX 1080 Ti 26幀。
RTX 2080幀率為80,領(lǐng)先GTX 1080 17幀。
古墓麗影:暗影
RTX 2080 Ti幀率為69FPS,領(lǐng)先GTX 1080 Ti 21幀。
RTX 2080幀率為55FPS,領(lǐng)先GTX 1080 15幀。
絕地求生
4K分辨率下,RTX 2080 Ti在《絕地求生》中也能跑出111FPS的幀率,領(lǐng)先GTX 1080 Ti 36幀。
RTX 2080的幀率為90,領(lǐng)先GTX 1080 26幀。
奇點(diǎn)灰燼
在《奇點(diǎn)灰燼》的測(cè)試中,RTX 2080 Ti跑出了91FPS的幀率,領(lǐng)先GTX 1080 Ti 21幀。
RTX 2080的幀率則為74FPS,領(lǐng)先GTX 1080 14幀。
突出重圍:人類分裂
RTX 2080 Ti的幀率為44FPS,領(lǐng)先GTX 1080 Ti 14幀。這是RTX 2080 Ti唯一沒有達(dá)到60FPS的游戲。
RTX 2080的幀率為35FPS,領(lǐng)先GTX 1080 15幀。領(lǐng)先幅度為60%。
生化危機(jī)7
在《生化危機(jī)7》的測(cè)試中,RTX 2080 Ti的幀率為126FPS,領(lǐng)先GTX 1080 Ti 43幀,領(lǐng)先幅度為52%。
RTX 2080的幀率為97FPS,領(lǐng)先GTX 1080 31幀,領(lǐng)先幅度為47%。
守望先鋒
RTX 2080 Ti的幀率為156FPS,領(lǐng)先GTX 1080 Ti 34幀。
RTX 2080的幀率則為122FPS,領(lǐng)先GTX 1080 16幀。
文明6
在4K分辨率下,GTX 1080 Ti以下的顯卡終于扛不住了,各種差距開始拉開,然而RTX 2080與RTX 2080 Ti性能仍未完全發(fā)揮,幀率與1080P分辨率完全一樣。
巫師3
在《巫師3》中,RTX 2080 Ti的幀率為82,領(lǐng)先GTX 1080 Ti 28幀,領(lǐng)先幅度為52%
RTX 2080的幀率為67,領(lǐng)先GTX 1080 20幀,
4K分辨率的測(cè)試數(shù)據(jù)匯總?cè)缦拢?
由于文明6過(guò)于依賴CPU性能,3DMark Fire Strike Ultra的跑分無(wú)法反應(yīng)圖靈性能,在計(jì)算性能百分比時(shí)并未加入這2個(gè)項(xiàng)目的測(cè)試數(shù)據(jù)。
在4K分辨率下,RTX 2080 Ti的性能得以釋放,相比GTX 1080領(lǐng)先了69%,和GTX 1080 Ti相比,有41%的領(lǐng)先幅度。
RTX 2080相比GTX 1080有36%的領(lǐng)先幅度,和GTX 1080 Ti相比,也能領(lǐng)先13%。
VEGA64的表現(xiàn)甚至不如2K分辨率,對(duì)GTX 1080的領(lǐng)先優(yōu)勢(shì)只剩下3%。
十三、CPU需求測(cè)試:4核4線程處理器無(wú)法勝任 i7-7700K老當(dāng)益壯
在7代酷睿年代,很多玩家覺得4核i5與頂級(jí)的4核i7處理器相比,在單機(jī)游戲上面方面沒有多少差異,為此我們收集了7款主流的CPU逐一測(cè)試,方便玩家了解頂級(jí)顯卡對(duì)CPU性能的需求。
1、測(cè)試平臺(tái)
因?yàn)锳MD平臺(tái)無(wú)法支持4000MHz頻率內(nèi)存條,測(cè)試時(shí)內(nèi)存統(tǒng)一采用3200MHz頻率
2、1080P分辨率測(cè)試
以下是1920x1080分辨率下7款CPU的測(cè)試成績(jī)匯總:
在1080P分辨率下,各種檔次的處理器跑出來(lái)的游戲幀數(shù)差別明顯,特別是沒有超線程功能里處理器嚴(yán)重限制了RTX 2080 Ti的性能。在多款游戲中,R5 1300X與i3-8100與頂級(jí)處理器之間都有超過(guò)50%的差距。
I7-7700K老當(dāng)益壯,游戲性能與默頻的8086K幾乎完全一樣,如果手上還有7700K的同學(xué),想要購(gòu)買RTX 2080級(jí)別的顯卡,可以不用升級(jí)處理器。4核4線程的R3 1300X和I3-8100完全無(wú)法發(fā)揮RTX 2080 Ti的性能。超頻到5.2GHz的8086K比默頻時(shí)提升了6%的幀數(shù)。
3、4K分辨率測(cè)試
以下是3840x1600分辨率下7款CPU的測(cè)試成績(jī)匯總:
4K分辨率最高特效下,壓力都在顯卡這一邊,除了《奇點(diǎn)灰燼》和《文明6》這2款比較吃CPU的游戲之外,其他游戲游戲的測(cè)試中,各款CPU的幀數(shù)差距并沒有很大。
在4K分辨率下,8086K、7700K、2700X、2600在處于同一檔次,6核6線程的I5-8400與前面幾款產(chǎn)品有6%的差距,R3 1300X和I3-8100這2款處理器落后的幅度沒有1080P那么明顯,但也有10%以上的差距。
4、內(nèi)存需求測(cè)試:
分別測(cè)試2133MHz單通道、2133MHz雙通道、4000MHz雙通道三種狀態(tài)下,RTX 2080 Ti的游戲幀數(shù),內(nèi)存容量16GB。測(cè)試數(shù)據(jù)如下:
由上表可以看出,2133MHz單通道已經(jīng)完全不能滿足RTX 2080 Ti的需求,比雙通道時(shí)普遍慢了20%左右,特別是在《奇點(diǎn)灰燼》、《古墓麗影10》、《古墓麗影11》和《孤島驚魂5》這幾個(gè)游戲中更是大幅度落后。
在使用4000MHz雙通道內(nèi)存后,相比2133MHz雙通道,還能額外增加8%的游戲性能。
這2年內(nèi)存價(jià)格居高不下,很多同學(xué)在購(gòu)機(jī)時(shí)往往選擇單條8GB內(nèi)存。如果想要發(fā)揮高端顯卡的實(shí)力,雙通道內(nèi)存是基本要求,必要時(shí)可以選擇高頻內(nèi)存條。
十四、超頻測(cè)試:核心幾無(wú)空間 顯存輕松15GHz
從帕斯卡開始,NVIDIA的BOOST 3.0技術(shù)就能在TDP允許的范圍內(nèi)最大限度提升核心頻率,基礎(chǔ)頻率僅有1.5GHz的GTX1070實(shí)際游戲中運(yùn)行頻率經(jīng)常能夠超過(guò)2GHz。BOOST 3.O已經(jīng)充分發(fā)揮了顯卡的潛力,導(dǎo)致留給玩家的超頻空間非常之小,一般也就能超過(guò)幾十MHz而已了。
到了圖靈時(shí)代,超頻會(huì)不會(huì)有所好轉(zhuǎn)呢?帶著這個(gè)疑問,我們對(duì)2張圖靈顯卡的超頻能力做了簡(jiǎn)要嘗試。
首先是RTX 2080,這張顯卡默認(rèn)TDP為225W,我們先將它拉到272W。
然后開始嘗試提升核心頻率,悲催的是,經(jīng)過(guò)反復(fù)測(cè)試,在不加電壓的情況下,最高只能將核心頻率增加可憐的65MHz,再加一點(diǎn)點(diǎn)運(yùn)行游戲時(shí)都會(huì)無(wú)響應(yīng)。
不過(guò)好在美光顯存超頻能力不錯(cuò),從14GHz拉到 15GHz都能穩(wěn)定運(yùn)行,此時(shí)顯卡的帶寬達(dá)到了480GB/s,與GTX 1080 Ti持平。
超頻之后3DMark Time Spy圖形分?jǐn)?shù)從默認(rèn)的10838增加到了11632,增長(zhǎng)了800分,提升幅度7.3%,核心頻率最高能到2070MHz,大多數(shù)時(shí)候維持在2000MHz上下。
同樣的事情也發(fā)生在RTX 2080 Ti身上,其默認(rèn)TDP為260W,我們將它拉到301W。然后在調(diào)整核心頻率的時(shí)候,也只能增加65MHz,顯存頻率則能從14GHz超至15GHz。
超頻之后的RTX 2080 Ti 3DMark Time Spy圖形分?jǐn)?shù)從默認(rèn)的13661增加到了14763,增長(zhǎng)了1100分,提升幅度8%。
十五、功耗溫度測(cè)試:能耗比提升40%
1、功耗測(cè)試
公版RTX 2080 TDP達(dá)到了225W較GTX 1080的180W增加了45W,而RTX 2080 Ti的TDP則為260W,比GTX 1080 Ti高出10瓦,讓我看看他們世界的表現(xiàn)如何。
分別測(cè)試待機(jī)與Furmark烤機(jī)功耗,測(cè)試所用的電源為酷冷至尊MasterWatt Maker1200W鉑金電源。
圖靈的功耗表現(xiàn)再一次給了我們驚喜,RTX 2080烤機(jī)時(shí)整機(jī)功耗只有305W,僅僅比GTX 1080高出了20W的功耗,卻有著40%的性能提升。與GTX 1080 Ti相比,功耗低了35W,性能則強(qiáng)了15%。
同樣的事情也發(fā)生在RTX 2080 Ti身上,其烤機(jī)功耗僅有330W。相比GTX 1080 Ti增加了768個(gè)流處理器,核心與顯存頻率都有所增加的情況下,功耗依然降低了10W,而性能則是強(qiáng)了40%以上。
對(duì)比AMD最強(qiáng)的VEGA 64,RTX 2080 Ti在性能幾乎翻倍的情況下,TDP只有對(duì)手的70%,能耗比差不多有3倍的差距。
2、溫度測(cè)試
由于參與對(duì)比評(píng)測(cè)的顯卡都已在倉(cāng)庫(kù)存放許久,可能會(huì)出現(xiàn)硅脂干化等情況,因此不對(duì)這些顯卡進(jìn)行溫度測(cè)試,我們?cè)谶@里只測(cè)試2張圖靈顯卡的溫度表現(xiàn)。測(cè)試時(shí)室溫26度、測(cè)試軟件為Furmark。
經(jīng)過(guò)5分鐘的Furmark烤機(jī)測(cè)試,RTX 2080的溫度穩(wěn)定在75度。
同樣是5分鐘的Furmark烤機(jī)測(cè)試,RTX 2080 Ti的溫度則穩(wěn)定在79度。
圖靈的公版顯卡舍棄了原來(lái)的渦輪風(fēng)扇改換成了現(xiàn)在的雙風(fēng)扇散熱系統(tǒng),溫度也好看了很多。RTX 2080烤機(jī)溫度只有75度,比GTX 1080低了8度,RTX 2080 Ti機(jī)溫度為79度,比GTX 1080 Ti低了6度。
十六、DLSS測(cè)試:鋸齒肉眼幾乎不可見 游戲性能毫無(wú)影響
3D游戲畫面在運(yùn)行時(shí),物體邊緣會(huì)產(chǎn)生“狗牙”(鋸齒),分辨率越低,鋸齒越嚴(yán)重,嚴(yán)重影響觀感。由此產(chǎn)生了許許多多的抗鋸齒技術(shù),例如SSAA、SMAA、FXAA、TAA。以上這些技術(shù)要么需要對(duì)額外的像素進(jìn)行渲染,要么需要對(duì)額外的幀進(jìn)行渲染,無(wú)論怎樣都需要消耗GPU資源,使游戲的幀率大大降低。有鑒于此,NVIDIA推出了DLSS(Deep Learning Super Sampling)深度學(xué)習(xí)超級(jí)采樣抗鋸齒技術(shù)。
不用于以往任何抗鋸齒技術(shù),DLSS使用圖靈核心中的Tensor單元來(lái)進(jìn)行運(yùn)算,不需要消耗CUDA單元,因此不會(huì)對(duì)顯卡的性能造成任何損失,不過(guò)卻能得到等同于TAA(時(shí)間抗鋸齒)的畫質(zhì)。
下面我們以最終幻想15 BenchMark程序來(lái)體驗(yàn)DLSS的效果。
1、畫質(zhì)對(duì)比
這是未開啟抗鋸齒的畫質(zhì),幀數(shù)很高,達(dá)到了59FPS。但是汽車邊緣的鋸齒感非常明顯,要知道這可是4K分辨率,如果降低到1080P,鋸齒現(xiàn)象會(huì)更加嚴(yán)重。
上圖是開啟了TAA抗鋸齒的畫面,汽車邊緣的鋸齒肉眼幾乎不可見,但幀率也降低至43FPS。
這是開啟了DLSS抗鋸齒的畫面,汽車的鋸齒也基本上幾乎看不到,但是幀率則維持在較高的57FPS,大大優(yōu)于開啟TAA時(shí)的表現(xiàn)。。
2、性能測(cè)試
GTX 1080/1080Ti開啟DLSS模式直接報(bào)錯(cuò),只能運(yùn)行TAA。
左邊是1080ti,開啟TAA模式測(cè)得3001分;右邊是GTX 1080,TAA模式下的分?jǐn)?shù)為2524分。
這是RTX 2080的測(cè)試成績(jī),左邊是開啟了DLSS,分?jǐn)?shù)為4547,右邊則開啟了TAA模式,分?jǐn)?shù)3353。
這是RTX 2080 Ti的測(cè)試成績(jī),左邊是開啟了DLSS,分?jǐn)?shù)為5812(很奇怪,超越了沒開AA的分?jǐn)?shù),測(cè)試3次均是如此),右邊則開啟了TAA模式,分?jǐn)?shù)4219。
測(cè)試成績(jī)匯總?cè)缦拢?
在NOAA模式下,RTX 2080 Ti比GTX 1080 Ti強(qiáng)42%,RTX 2080比GTX 1080強(qiáng)了32%。開啟TAA后,每張顯卡都要損失25%左右的性能。但是2張圖靈顯卡在開啟DLSS后,性能都沒有下滑,RTX 2080 Ti性能甚至還有提升。
至于圖靈DLSS與帕斯卡TAA性能對(duì)比,RTX 2080 Ti相比GTX 1080 Ti領(lǐng)先幅度增加到了93%,而RTX 2080相比GTX 1080領(lǐng)先幅度也提升到了80%。由此看來(lái)NVIDIA官方宣傳的RTX 2080 DLSS性能相比GTX 1080 TAA提升一倍也有一定的依據(jù)。
十七、光線追蹤測(cè)試:體驗(yàn)真實(shí)世界的光影效果
傳統(tǒng)的光柵化渲染是將一個(gè)3D圖形的幾何信息轉(zhuǎn)變?yōu)橐粋€(gè)個(gè)柵格組成的2D圖像的過(guò)程,可以理解為在這個(gè)3D圖形的每個(gè)點(diǎn)都包含有顏色、深度以及紋理數(shù)據(jù),經(jīng)過(guò)一系列計(jì)算變換后,將其轉(zhuǎn)換為2D圖像的像素,進(jìn)而呈現(xiàn)在顯示設(shè)備上。
這一過(guò)程也就構(gòu)成了我們愛游戲中所看到的各類陰影效果以及光線投射,在這過(guò)程中所有的光影效果都是提前設(shè)計(jì)好的,如果開發(fā)者設(shè)計(jì)時(shí)不那么嚴(yán)謹(jǐn),就會(huì)在不應(yīng)該有陰影的地方出現(xiàn)陰影。同時(shí)即便耗費(fèi)巨大精力去提前設(shè)計(jì)好的所有陰影的可能情況,也只能做到無(wú)限接近于真實(shí),況且這一點(diǎn)本身也很難做到。于是實(shí)時(shí)光線追蹤(ray tracing)便成為了玩家與游戲開發(fā)者最終極的選擇與夢(mèng)想。
傳統(tǒng)的光線追蹤技術(shù)是以光源為起點(diǎn)定義光線,進(jìn)而追蹤由此產(chǎn)生的光線與物體表面以及光線與光線之間交互關(guān)系的過(guò)程。但該技術(shù)目前實(shí)現(xiàn)起來(lái)非常困難,因?yàn)檫@一技術(shù)需要無(wú)限多的光線照射在物體表面,通過(guò)反射、折射、漫射等途徑進(jìn)入最終的“攝像機(jī)”成像。這一過(guò)程需要耗費(fèi)大量的算力且會(huì)有大量光線損失。因此光線追蹤技術(shù)自誕生之日起,就有人斷言20年之內(nèi)光線追蹤不可能實(shí)現(xiàn)。
然而天才的NVIDIA工程師們解決了這個(gè)難題。提出了一種新的Ray tracing理念,即是通過(guò)進(jìn)入“攝像機(jī)”的光線,來(lái)回溯尋找光源。大部分從光源發(fā)出被折射或者漫反射不被玩家所看到的光線將不會(huì)被運(yùn)算,這種思路將需要實(shí)時(shí)計(jì)算的光線數(shù)量降低了數(shù)十倍,使得實(shí)時(shí)光線追蹤技術(shù)至少提前十年成為現(xiàn)實(shí)。
下面我們通過(guò)3Dmark Ray Tracing Tech Demo來(lái)體驗(yàn)光線追蹤的奇妙之處。
從上面2張圖可以可以明顯的看到小飛行器飛行時(shí),在飛船上的倒影也是一直在變化方位。小飛機(jī)器自身也在發(fā)光,因此它的倒影的明暗度以及形狀也是隨時(shí)在發(fā)生著變化。
除此之外,大飛船本身也在緩慢滑行,周圍的環(huán)形燈柱投射在飛船上的倒影也是無(wú)時(shí)無(wú)刻都在變化著。
RTX 2080 Ti集成了68個(gè)RT Cores,每秒能處理100億條光線,而GTX 1080 Ti只能靠CUDA來(lái)計(jì)算光線,每秒能處理11億光線。下面我們通過(guò)星球大戰(zhàn)DEMO來(lái)演示光線追蹤的性能,這個(gè)DEMO可以為展現(xiàn)出一個(gè)如果科幻電影般的光影世界。
這是 GTX 1080 Ti的幀率,非??D,僅有3.31FPS
由于星球大戰(zhàn)DEMO鎖定24FPS,RTX 2080與RTX 2080 Ti都只能跑出24幀,即便如此,也達(dá)到了GTX 1080 Ti 7倍以上的性能。
十八、總結(jié):NVIDIA完成自我突破 圖靈徹底無(wú)敵
毫不夸張的說(shuō),圖靈是NVIDIA是十年來(lái)最大的一次構(gòu)架更新,其意義不亞于2006年發(fā)布的世界上第一塊支持DirectX 10 的代號(hào)為G80的GeForce 8800 Ultra顯卡。圖靈的改進(jìn)如此之多,我們此篇評(píng)測(cè)只是測(cè)試了其中一部分特性,之后還會(huì)有一篇補(bǔ)充評(píng)測(cè)。
圖靈第一次將深度學(xué)習(xí)引入了游戲卡中,目前來(lái)說(shuō)最主要的用途就是DLSS(深度學(xué)習(xí)超級(jí)采樣抗鋸齒),他能提供與TAA抗鋸齒技術(shù)幾乎相同的畫質(zhì)(未來(lái)會(huì)在畫質(zhì)上會(huì)超越TAA),但絲毫不會(huì)影響到游戲性能,在我們的測(cè)試中,RTX 2080 DLSS的性能領(lǐng)先GTX 1080 TAA達(dá)到了80%。
而RTX(實(shí)時(shí)光線追蹤)是一項(xiàng)革命性的技術(shù),NVIDIA花了整整10年時(shí)間來(lái)開發(fā),才有現(xiàn)在的成果。過(guò)去所有的陰影技術(shù)無(wú)論看上去多么逼真,其實(shí)都是虛假的,實(shí)時(shí)光線追蹤技術(shù)能構(gòu)造出一個(gè)完全真實(shí)的光影世界。RTX 2080 Ti集成了68個(gè)RT核心,RTX-OPS性能十倍于GTX 1080 Ti,在星球大戰(zhàn)DEMO測(cè)試中,后者僅能跑出3FPS的幀率,而RTX 2080/2080 Ti能輕松達(dá)到24FPS。
Turing還在每個(gè)流處理中增加了一個(gè)INT32整數(shù)單元,能將流處理器運(yùn)算效能提升36%,因此在我們的測(cè)試中,2944個(gè)流處理器的RTX 2080在游戲性能上比3584個(gè)流處理器的GTX 1080 Ti還要強(qiáng)了15%以上,而功耗更低。在能耗比這個(gè)指標(biāo)上,圖靈相比帕斯卡至少有30%的提升。
再來(lái)說(shuō)說(shuō)NVIDIA的老對(duì)手AMD。最近幾年AMD的GPU研發(fā)幾近停滯,相比NVIDIA一次又一次的徹底更新內(nèi)核構(gòu)架,AMD則是一個(gè)GCN構(gòu)架從2011年一直用到現(xiàn)在(VEGA構(gòu)架也是GCN之上做了一些修修補(bǔ)補(bǔ))。目前VEGA與圖靈的能耗比差距已經(jīng)達(dá)到了3倍之多,這個(gè)差距之大,可能即將發(fā)布的7nm的VEGA游戲卡都難以彌補(bǔ),然后明年又要面對(duì)NVIDIA 7nm制程工藝的安培,結(jié)局不用想都很明了!
再說(shuō)說(shuō)圖靈的售價(jià),雖說(shuō)他的性能完全對(duì)得起價(jià)格,但是售價(jià)一萬(wàn)元的游戲顯卡已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)的普通玩家的預(yù)算以及預(yù)期。如果AMD不能推出一款類似于圖靈這樣革命性的GPU構(gòu)架,未來(lái)很長(zhǎng)一段時(shí)間,獨(dú)立顯卡都將是NVIDIA一人的獨(dú)角戲。
標(biāo)簽 游戲- 原標(biāo)題:NVIDIA RTX 2080/RTX 2080 Ti首發(fā)評(píng)測(cè):感受12年來(lái)GPU最大革命
- 責(zé)任編輯:呂棟
- 最后更新: 2018-09-19 22:39:21
-
上海警方:竊取華住旗下酒店數(shù)據(jù)信息嫌疑人已被抓獲
2018-09-19 20:02 依法治國(guó) -
青春不是減配!小米8青春版亮相 華為P20要哭了
2018-09-19 18:10 手機(jī)硬件 -
虛假宣傳對(duì)手 法院二次責(zé)令泰迪熊移動(dòng)向小源科技道歉
2018-09-19 17:04 商業(yè) -
阿里成立平頭哥半導(dǎo)體公司,稱兩三年內(nèi)要打造真正量子芯片
2018-09-19 15:08 大公司 -
科技早報(bào)|文章《誰(shuí)在殺死騰訊》被微信提示標(biāo)題夸大誤導(dǎo)
2018-09-19 11:45 -
美媒:與中國(guó)比高鐵,我們簡(jiǎn)直第三世界
2018-09-19 10:52 美國(guó)一夢(mèng) -
萬(wàn)元新iPhone降價(jià)賣,賣家照樣賺錢,為何?
2018-09-19 09:18 蘋果新“品” -
華為輪值CEO胡厚崑:5G落地后會(huì)比4G安全一倍
2018-09-18 16:43 IT新浪潮 -
三星在天津投資30億人民幣擴(kuò)產(chǎn)MLCC
2018-09-18 16:32 大公司 -
SpaceX繞月飛行首單旅客:日本億萬(wàn)富翁前澤友作
2018-09-18 15:36 航空航天 -
哈啰CEO楊磊談改名:短期看我們像滴滴,長(zhǎng)期走的路不同
2018-09-18 15:22 -
臉書加強(qiáng)審查 并設(shè)置“人權(quán)專員”
2018-09-18 15:06 美國(guó)政治 -
中國(guó)制造趕德超美的秘密在這!德勤中國(guó)智能制造深度報(bào)告
2018-09-18 14:30 -
科技早報(bào)|二維火:美團(tuán)涉嫌破壞系統(tǒng)已立案 周一中概股多數(shù)下跌
2018-09-18 09:37 -
我國(guó)科技期刊尷尬:一二流投國(guó)外,三四流投國(guó)內(nèi)
2018-09-18 07:53 科技前沿 -
工業(yè)富聯(lián)再創(chuàng)上市以來(lái)新低 距破發(fā)僅一步之遙
2018-09-17 22:33 -
又雙叒叕炸了?三星Note9在美國(guó)發(fā)生自燃事件
2018-09-17 16:40 手機(jī)硬件 -
攤上事!極驗(yàn)指控網(wǎng)易云易盾惡意占用LOGO
2018-09-17 16:24 科技前沿 -
亞馬遜內(nèi)部員工賣數(shù)據(jù)刪差評(píng) 中國(guó)區(qū)情節(jié)最嚴(yán)重
2018-09-17 16:17 -
馬云:我們不該擔(dān)心機(jī)器智能超越人類智慧
2018-09-17 13:05
相關(guān)推薦 -
IMF對(duì)華講公道話,美媒酸了 評(píng)論 41美國(guó)發(fā)布首份AI備忘錄,“得防中國(guó)戰(zhàn)略突襲” 評(píng)論 94普京回應(yīng)“朝軍援俄”傳聞 評(píng)論 229“我們目前世界領(lǐng)先,但中國(guó)人正敲開我們的大門” 評(píng)論 152“不止美德,北約至少七國(guó)反對(duì)” 評(píng)論 84最新聞 Hot
-
美國(guó)發(fā)布首份AI備忘錄,“得防中國(guó)戰(zhàn)略突襲”
-
“英國(guó)軍情五處完全在胡說(shuō)八道”
-
普京回應(yīng)“朝軍援俄”傳聞
-
被批“中國(guó)有支票美國(guó)有清單”,他又畫餅忽悠…
-
又嗆上了:野蠻人也好意思自詡捍衛(wèi)文明…
-
沒中國(guó)能成嗎?澳大利亞部長(zhǎng)這么說(shuō)
-
特朗普威脅襲擊莫斯科市中心?普京回應(yīng)
-
“我們目前世界領(lǐng)先,但中國(guó)人正敲開我們的大門”
-
“我不太喜歡談?wù)摳?jìng)爭(zhēng),但我開的是小米”
-
盧卡申科評(píng)“朝軍援俄”:胡說(shuō)八道,普京不是這性格
-
“不止美德,北約至少七國(guó)反對(duì)”
-
華裔老板拒絕“背書”哈里斯,加州第一大報(bào)編委辭職
-
英高級(jí)外交官搶、奪、撕...扎哈羅娃怒斥
-
連他都不敢說(shuō),“怕被特朗普?qǐng)?bào)復(fù)”
-
134條!金磚通過(guò)《喀山宣言》,“將在聯(lián)合國(guó)分發(fā)”
-
“我們?cè)缸鲆磺蟹现袊?guó)利益的事”
-