nvidia titan x評測 NVIDIA TITAN X顯卡性能全面深度評測－IT工程師數位筆記本

文章出處

　　有這么一個顯卡系列，不以數字命名，因為用數字不足以詮釋它的獨特和強大;有這么一個顯卡系列，每次出現必定轟動業界，讓N飯們歡呼雀躍;有這么一個顯卡系列，模糊游戲卡和專業卡的邊界，是業界當之無愧的“跨界卡王”。沒錯，熟悉顯卡的朋友們都知道，吉吉我說的正是NVIDIA的傳奇顯卡系列——TITAN，而今天，我將為大家帶來的是目前最新也是最強的泰坦卡——NVIDIA TITAN X的評測。

　　由于NVIDIA TITAN X供貨極為有限，所以NVIDIA一直都沒有為國內媒體送測新TITAN X，廠商也舍不得為媒體送測這么昂貴的顯卡，因此國內科技媒體網站上便一直都沒有TITAN X的相關專業評測，我們只能通過民間土豪玩家的帖子和外媒的測試結果來對這塊卡的性能了解個大概，這不得不說是一個遺憾。為了滿足心中一窺最強性能的渴望，吉吉我在GTX 1080 Ti發布的前夕借來了一塊NVIDIA TITAN X，并以最快的速度對該卡進行了相關測試。雖然大家都知道該卡毫無疑問是目前最強的單芯顯卡，但究竟強到什么程度?就讓我來告訴你吧!

　　NVIDIA TITAN X包裝盒

　　NVIDIA TITAN X發布于7月末，據說是因為一個賭注而誕生的。老黃在2016年7月22日參加斯坦福大學的AI會議的時候情不自禁地介紹了NVIDIA的全新TITAN顯卡——NVIDIA TITAN X，于是NVIDIA也就順勢把這塊新卡皇給放到了官網上。老黃在會議的演講中說到，TTXP的誕生源于一次打賭，對象是Brian Kelleher，NVIDIA的首席硬件工程師，老黃不相信Kelleher能夠做出單芯10 TFLOPS的顯卡，于是Kelleher便做出了新TITAN X，該卡的單精度達到了11 TFLOPS，創下了顯卡界單芯顯卡單精度歷史新高。

　　漆黑酷炫的外觀

　　該卡的命名比較有意思，上代卡泰坦卡叫“NVIDIA GeForce GTX TITAN X”，這一代居然沒有重新命名，只是簡單粗暴地省略了“GeForce GTX”，就叫做“NVIDIA TITAN X”。然而好玩的是，該卡的背板上刻有型號名，刻的是“GeForce GTX TITAN X”，簡直不能更亂，因此很多玩家直接稱呼這代為“TITAN X Pascal”或“新TITAN X”，簡稱“TTXP”。

　　背板必不可少

　　這塊卡沒有采用Pascal架構完整的GP100核心，而是精簡掉雙精度單元的GP102核心，流處理器數量為3584個。NVIDIA TITAN X的推出不僅引來了陣陣歡呼，也遭到了玩家的瘋狂吐槽，因為新TITAN X用的居然不是完整核心，比完整GP100核心少了256個CUDA處理器。NVIDIA TITAN X售價近1萬塊，買這塊卡的玩家大部分都是因為信仰，但如此有信仰的卡王居然不完美，這讓廣大N飯怎么能忍?那么完整核心去哪里了?精明的老黃居然把完整核心用在了Quadro P6000上，這塊專業卡的售價超過了3萬，也就是說想要“原汁原味”的信仰，你得掏出3倍的價格。不過即使不完整，NVIDIA TITAN X依舊是N飯的終極夢想，因為沒有在中國首發，所以有些玩家甚至以1.5倍以上的價格從黃牛手里淘到了這款卡。

　　其名為“TITAN X”

　　背景鋪敘完畢，該來說說測試部分了。吉吉我為了體現NVIDIA TITAN X的實力，選擇了一塊GTX 1080 Founders Edition以及一塊GTX TITAN X作為主要對比對象，并且考慮到三款卡都是旗艦級顯卡，測試常規1080p分辨率已經沒有什么意義了，因此我們的測試中只包含2K分辨率和4K分辨率。此外，由于吉吉我手中沒有R9 Fury X和Radeon Pro Duo了，AMD的Vega還沒有發布，因此便沒有與AMD顯卡進行對比。接下來就讓我們一起見證什么是最強吧!

　　卓越的Pascal大核心

　　NVIDIA TITAN X采用全新16nm制程的Pascal架構，核心代號為GP102，具體型號為GP102-400-A1，而Quadro P6000的核心代號為GP102-425-A1。GP102核心面積約為471平方毫米，得益于16nm的制程優勢，核心內集成了12億晶體管，是GTX TITAN X晶體管數量的1.5倍，核心面積卻僅為GTX TITAN X的78.4%。

顯卡規格比較表
顯卡型號	NVIDIA TITAN X	GTX TITAN X	GTX 1080	R9 Fury X
首發限價	$1200	$999	$699	$650
GPU代號	GP102	GM200	GP104	Fiji XT
GPU工藝	16nm	28nm	16nm	28nm
GPU晶體管	12B	8B	7.2B	8.9B
著色器數量	3584	3072	2560	4096
單精度浮點	11 T	7 T	9 T	8.6 T
ROPs數量	96	96	64	64
紋理單元數量	224	192	160	256
核心頻率	1418MHz	1002MHz	1607MHz	1050MHz
boost頻率	1531MHz	1076MHz	1733MHz	1050MHz
架構	Pascal	Maxwell 2	Pascal	GCN 1.2
顯存頻率	1251 MHz	1753 MHz	1250 MHz	500 MHz
內存位寬	384 bit	384 bit	256 bit	4096 bit
內存帶寬	505 GB/s	336.6 GB/s	320 GB/s	512 GB/s
內存類型	GDDR5X	GDDR5	GDDR5X	HBM
內存容量	12 GB	12 GB	8 GB	4 GB

　　注：表中售價均為官方首發限價

　　基于Pascal架構的GP102-400芯片運算資源總量為3584個ALU，比GP102-425少了256個;GP102-400的TMUs數量為224個，后端的ROPs數量為96個，6個帶寬為64bit的雙通道顯存控制器組成了總量為384bit的顯存控制單元，大小為12GB。同GTX TITAN X相比，其各項參數均有所提升，尤其是顯存帶寬達到了505GB/s，這是因為其采用了GDDR5X顯存，GDDR5X顯存的改進使得NVIDIA TITAN X在位寬相同的情況下擁有更高的帶寬。

　　GP102-400架構圖

　　我們可以看到，NVIDIA TITAN X的默認核心頻率為1418MHz，Boost頻率為1531MHz，達到了上代GTX TITAN X頻率的1.4倍，提升幅度非常明顯。NVIDIA TITAN X的默認Pixel Fillrate能力達到了155.8Gpiexls/S，默認Texture Fillrate能力為363.6Gtexels/S。憑借超高的基礎頻率和龐大的運算規模，NVIDIA TITAN X擁有11 TFLOPS的超高單精度浮點運算能力，照比GTX TITAN X提升了57%，為目前單精度浮點運算性能最高的單芯顯卡。

　　SMs單元架構圖

　　Pascal架構GP104-400芯片由以下主要的部分組成：

　　1、基于TSMC的16nm FinFET Plus工藝，相比28nm HPM提升了65%的性能或者減少了70%的能耗，同時晶體管密度翻倍。

　　2、6單元的宏觀并行結構，30組SMs單元被分為6個GPC，每個GPC包含5組SMs，但砍掉了2祖SMs單元，因此總量為28個，相對應地，紋理單元縮減為224個。

　　3、28組全新設計的，包含了幾何引擎、光柵化引擎以及線程仲裁管理機制的SMs單元。每個SMs單元包含一組負責處理幾何任務需求的PolyMorph Engine，同時均下轄5組更基本的SM單元，每個SMs單元包含8個負責處理材質以及特種運算任務如卷積、快速傅里葉變換等的Texture Array，四組并行的二級線程管理機制以及對應的shared+Unified Cache等緩沖體系。

　　4、GP102擁有12個32位顯存控制器，總計384位，每個32位顯存控制器包含8個ROPs單元和256KB二級緩存，共計96個ROPs單元和3M二級緩存。

　　5、改進型的4.0版本PolyMorph Engine，包含了為VR設計的The Simultaneous Multi-Projection Engine，在極端情況下，SMP引擎可以減少32倍VR所需的幾何渲染工作量。

　　在NVIDIA TITAN X上，我們看到了其與上代基于Maxwell 2.0架構顯卡相類似的設計，主要區別就是每個GPC中多了一組SMs單元，這就讓這款顯卡能夠支持所有在GeForce GTX 900系列中的特性。

　　顯卡拆解賞析

　　從外形上可以看出，除了其散熱器外殼、顯卡名稱和散熱鰭片顏色互相對調以外，其他地方TITAN X和GTX 1080 FE是相同的。

　　顯卡正面外觀

　　TITAN X采用公版標配的渦輪散熱器，渦輪將熱空氣經I/O區散熱孔中吹出，渦輪扇的最大轉速被限制在55%，也就是2300轉左右，這點跟GTX TITAN X的渦輪扇相同。

　　顯卡背版

　　拆掉一半背板

　　老黃稱GTX TITAN X沒有背板是為了讓多卡SLI有更好的散熱，這點顯然不會被玩家所認可，所以NVIDIA TITAN X上搭載了全新設計的背板，在組建SLI平臺時，可以卸掉一半背板來增加氣流量，以此來增強散熱效果。

　　顯卡散熱器外殼

　　拆掉散熱器外殼

　　真空腔均熱板散熱模塊

　　作為TDP高達250W的旗艦顯卡，真空腔均熱板是必要的存在，沒記錯的話NVIDIA從GTX 580開始便使用這種技術，而該技術截止到目前仍是最先進的散熱技術之一。

　　顯卡中框和渦輪扇

　　NVIDIA TITAN X的全金屬中框既可以加固顯卡，又可以起到一定的輔助散熱作用，在中框上貼有導熱墊，輔助顯存等高發熱部位散熱。顯卡搭載的渦輪扇十分靜音，即使在高負載情況下，不仔細聽也很難聽到風扇的風流聲。

　　顯卡PCB設計

　　通過分析PCB我們可以看到，NVIDIA TITAN X的顯存使用了來自美光的GDDR5X，12顆便構成了該卡12GB的顯存規格，所以核心背面的PCB是閑置的，有顯存的空焊位。背面的12個空焊位是干嘛的呢?Quadro P6000的顯存容量是24GB，其采用跟NVIDIA TITAN X相同的PCB設計，這背面的空焊位就是為這款卡準備的。

　　顯卡供電設計

　　NVIDIA TITAN X的供電設計采用了7+1+1相設計，相比之前GTX 1080的5+1強了不少，而且GTX 1080的好多項供電的MOS管都有虛焊位，但NVIDIA TITAN X設計得就比較“滿”。就料件的品質來說，高品質貼片電感、鉭電容等高檔元器件是沒什么值得挑剔的，旗艦畢竟是旗艦。

　　顯卡核心

　　NVIDIA TITAN X上的芯片自然是全尺寸Pascal游戲核心，代號為GP102-400-A1，在晶體管數量漲了半倍的情況下，照比GTX TITAN X的核心面積卻小了22%，比GTX 980的核心要稍稍大上一些。

　　供電接口設計

　　NVIDIA TITAN X采用8+6pin輔助供電接口，這也是NVIDIA 250W TDP公版顯卡的標配了，加上PCI-E最大可提供300W功率，足夠顯卡在高頻下穩定工作，并且有著一定的超頻能力。

　　視頻接口設計

　　由于采用與GP104和GP106相同的顯示控制器，因而NVIDIA TITAN X與GTX 1080的視頻輸出接口完全一樣，接口分別為：DP1.4*3、HDMI*1、DVI*1。

　　測試平臺環境一覽

　　為保證測試能夠發揮顯卡的最佳性能，本次測試平臺采用全新7代酷睿芯——Intel酷睿i7-7700K處理器、技嘉Z270芯片組主板、影馳 Gamer DDR4-2400 8GB 雙通道內存、安鈦克1000w鈦金電源組建而成。詳細硬件規格如下表所示:

測試平臺軟硬件配置
核心配件
CPU	Intel	酷睿i7-7700K
主板	技嘉	GA-Z270X-Gaming 9
核芯顯卡	Intel	HD 630
內存	影馳	Gamer DDR4-2400 8GB x4
硬盤	浦科特	PX-512M6S+
電源	安鈦克	HCP 白金版-1000
系統及驅動程序
操作系統	Microsoft Windows 10
主板驅動	Intel芯片組驅動
顯卡驅動	NVIDIA GeForce Game Ready Driver（378.66 WHQL）
DirectX環境	DirectX 12
幀數監控	Fraps 3.5.1

　　測試用主板：技嘉GA-Z270X-Gaming 9

　　測試用內存：影馳 GAMER DDR4-2400 8GB*4(玩家主場電競內存)

　　測試用固態硬盤：浦科特 PX-512M6S+

　　在測試成績方面，理論性能測試用得分來衡量性能，數值越高越好;游戲性能測試用游戲自帶Benchmark及游戲中平均幀數來衡量性能，數值同樣越高越好。

　　理論性能測試：3DMark FireStrike

　　首先進行的是用來衡量顯卡理論DX11性能的3DMark FireStrike測試，選擇模式為Extreme，對應的是2K分辨率，測試結果如下：

　　3DMark FSE GPU成績

　　在3DMark FireStrike Extreme測試中，NVIDIA TITAN X的GPU得分超過GTX 1080約32%，超過上代GTX TITAN X約73%，實力毋庸置疑。接下來我們測試一下該卡的理論DX12性能，使用的是3DMark Time Spy，對應的同樣是2K分辨率，結果如下：

　　3DMark TS GPU成績

　　在3DMark Time Spy測試中，NVIDIA TITAN X的GPU得分超過GTX 1080約30%，超過上代GTX TITAN X約82%，可見Pascal架構的DX12性能照比Maxwell有很大提升。最后我們來測試一下顯卡的VR性能，使用的是SteamVR Performance Test，測試結果如下：

　　NVIDIA TITAN X平均保真度為11

　　雖然在VR測試中NVIDIA TITAN X的保真度同GTX 1080一樣為11，但區別還是很明顯的：NVIDIA TITAN X的保真度呈現出一條完美的直線，沒有絲毫振動，而且已測試幀數達到了20000幀以上，GTX 1080只達到了15000幀，單就已測試幀數看，NVIDIA TITAN X超過GTX 1080 33%左右，而GTX TITAN X的保真度雖然也高達10.7，,但幀數遠遠落后于NVIDIA TITAN X。

　　DX12游戲性能測試

　　在游戲性能測試環節，我們選取了4款DX12游戲和3款DX11游戲進行測試，測試分辨率為2K和4K。在測試中將所有游戲的特效設置為最高，關閉垂直同步，選用適當的抗鋸齒，用游戲內自帶benchmark或Fraps記錄下平均幀數，首先是DX12游戲的測試，結果如下：

　　《殺手6》幀數對比

　　《古墓麗影：崛起》幀數對比

　　《戰錘：全面戰爭》幀數對比

　　《全境封鎖》幀數對比

　　通過以上的測試結果可知，不算《全境封鎖》，以上三款旗艦顯卡均可以在2K下完美運行各款游戲大作，但在4K超清分辨率下，只有NVIDIA TITAN X可以達到絕對流暢的60幀，其性能之強悍不言而喻。綜合來看，在2K分辨率下，NVIDIA TITAN X領先GTX 1080 FE約30%，領先GTX TITAN X約60%;在4K分辨率下，NVIDIA TITAN X領先GTX 1080 FE約32%，領先GTX TITAN X約64%。

　　最后我們來說一說《全境封鎖》，大家都知道《全境封鎖》在之前是我們測試顯卡DX11游戲性能最常用的一個游戲，但在更新了1.5版本之后，《全境封鎖》加入了DX12模式，因此我們此次便在該模式下進行游戲測試。不過經測試發現，該游戲的DX12模式并不會提升游戲性能，反而導致性能有所下降，因此最終呈現的結果是強如NVIDIA TITAN X在4K模式下也只是達到了相對流暢的49幀，上代旗艦GTX TITAN X只能達到31幀的及格幀數，可見更新后的《全境封鎖》真可謂是硬件殺手。

　　DX11游戲性能測試

　　測試完三款卡的DX12游戲性能，我們再來看一下它們在DX11游戲中的表現。需要說明的是，我們之前做的《狙擊精英4》的AN對比評測是在DX12模式下，我們這次選擇在DX11模式下進行測試，最終測試結果如下：

　　《狙擊精英4》幀數對比

　　《孤島驚魂：原始殺戮》幀數對比

　　《守望先鋒》幀數對比

　　通過以上的測試結果可知，以上三款旗艦顯卡均可以在2K下完美運行各款游戲大作，但在4K超清分辨率下，NVIDIA TITAN X也沒能做到全游戲制霸，但可以達到非常流暢的程度，這是GTX 1080和GTX TITAN X所做不到的。綜合來看，在2K分辨率下，NVIDIA TITAN X領先GTX 1080 FE約31%，領先GTX TITAN X約62%;在4K分辨率下，NVIDIA TITAN X領先GTX 1080 FE約33%，領先GTX TITAN X約62%。

　　第8頁：顯卡功耗及溫度測試

　　顯卡功耗及溫度測試

　　溫度方面我們將繼續采用FurMark來進行測試，考慮到不同游戲之中，顯卡的負載率不同，尤其是低分辨率和高分辨率的負載率差異會讓顯卡的功耗完全無法測算平均數值。因此我們需要采用Furmark這樣的權威性烤機軟件，讓GPU芯片之中每一個運算單元完全滿載，充分發揮供電最大化的狀態才能得出準確的成績。

　　顯卡烤機溫度為84℃

　　滿載溫度方面我們是采用Furamrk拷機，讓顯卡達到滿載狀態，然后根據GPU-Z顯示的數值來測量溫度。我們將參數設定為1280*1024分辨率，開啟8*MSAA。在烤機10分鐘后，最終顯卡的滿載溫度為84℃，符合公版顯卡的一貫水準，最終核心頻率穩定在1708MHz，比額定boost頻率還要高170Mhz左右。

　　各卡烤機溫度對比

　　近些年NVIDIA公版旗艦卡的滿載溫度一般都是在80-85℃之間，可以看出3款旗艦卡彼此間的滿載溫度只是相差1-2℃，這主要和公版散熱器的設計有關，如果采用非公版散熱器的話。NVIDIA TITAN X的烤機溫度應該可以降至70℃以下，不過遺憾的是市面上并沒有非公版產品，對溫度敏感的玩家可以自行對卡進行水冷改造。

　　各卡功耗對比

　　待機功耗方面，所有參測顯卡所在平臺的功耗均在50w左右，采用Maxwell架構的GTX TITAN X稍微高一些，這說明在空載狀態下，參測顯卡的耗電程度是差不多的;而滿載平臺功耗方面，TDP同為250W的NVIDIA TITAN X和GTX TITAN X基本持平，GTX 1080比兩者低70W左右，符合GTX 1080 180W的TDP。

　　顯卡超頻性能測試

　　我們本次超頻測試使用的是微星的Afterburner顯卡超頻軟件，我們將顯卡核心頻率拉高200MHz，等效顯存頻率拉高510MHz，這個幅度是非公版GTX 1080之于GTX 1080 FE版的提升幅度，此時的顯卡參數如下：

　　顯卡超頻前后參數對比

　　可以看到，超頻后的顯卡核心頻率升至1623MHz，boost后達到了1736MHz，等效顯存頻率為10520MHz。然而這個頻率并不代表實際的運行頻率，憑借GPU boost 3.0強大的升頻實力，根據GPU-Z檢測，在運行游戲時的實際頻率達到了1.9GHz，基本算是這款卡的風冷極限了，然后再進行3DMark FireStrike Extreme測試，測試結果如下：

　　超頻后3DMark FSE GPU得分為15022分

　　通過測試我們可以看出，在超頻后，NVIDIA TITAN X最終得到了13401分，GPU分數更是達到了15022分，這個分數照比超頻前提升了約9%，超過GTX 1080 FE約46%，可謂是壓倒性的優勢。由此可見，GP102-400芯片的潛力是很大的，如果玩家使用改裝后的水冷散熱器的話，完全可以在超頻情況下使用，收獲更強的性能。

　　第10頁：不是最強的最強

　　不是最強的最強

　　通過上面的測試可以發現，NVIDIA TITAN X毫無疑問是目前性能最強的單芯游戲卡，沒有之一，其游戲性能差不多是GTX 1080的1.3倍，是上代GTX TITAN X的1.6倍，在4K超清分辨率下也可以征服市面上絕大多數的單機大作，更不用說在2K和1080p分辨率下了。然而該卡卻不是目前性能最強的單芯卡，最強的是完整GP102核心的Quadro P6000，單精度浮點運算性能比NVIDIA TITAN X還高1 TFLOPS。

　　無數玩家的夢想

　　在TITAN系列發布之初，NVIDIA是將其定義為一款“跨界顯卡”，憑借1/3單精度的雙精度設計，GTX TITAN和GTX TITAN Black Edition除游戲外也被大量應用在科學運算上。為了進一步控制功耗，二代泰坦GTX TITAN X閹割掉了雙精度，跟游戲卡一樣為1/32單精度，基本淪為單純的游戲卡，不過好在還是完整核心，信仰滿滿。而到了第三代NVIDIA TITAN X，不僅雙精度弱成渣，連完整核心都不是了，不得不讓人懷疑老黃到底要鬧哪樣。

　　Darker Than Black

　　吉吉我個人分析有3種可能：1、TITAN系列的定位徹底轉變成有信仰的游戲卡，而NVIDIA頂級的GPU系列還是Tesla和Quadro，為了給這兩個系列讓路，未來TITAN系列的規格將一直有所削減;2、這次發布的NVIDIA TITAN X定位不是旗艦，為了應對實力莫測的Vega，老黃留了一手，未來會推出完整核心的NVIDIA TITAN X，就像GTX TITAN和GTX TITAN Black Edition的關系一樣;3、GP102-400核心準備得比較早，出于方便直接用Tesla的GP100核心閹割掉雙精度，當時NVIDIA可能還未考慮這么快放出完整核心的產品，這個核心本打算是留給GTX 1080 Ti的。

　　立體感十足的外觀

　　可是不管怎樣，既然叫做TITAN，其自然會有著對得起名號的性能和身價，NVIDIA TITAN X的首發限價為1200美元，比GTX TITAN X首發時貴了有200美元，是GTX 1080首發價格的2倍。如此高昂的售價和極少的出貨量證明，TITAN系列顯卡依舊是尊貴的象征，是頂級發燒友夢寐以求的信仰之物。有的人會說，NVIDIA TITAN X性價比這么低，有幾個人會買?但實際情況是，京東始終處于缺貨狀態，一補貨瞬間就被搶光，網上普遍加價出售，可見玩家們熱情之高。

　　顯卡界巔峰之作

　　就在今天，NVIDIA正式發布了GeForce GTX 1080 Ti，在截稿時吉吉我還不知道該卡的性能，但根據以往的經驗可知，其應該不輸于NVIDIA TITAN X，但價格上會便宜不少。GTX 1080的4K征服夢將由GTX 1080 Ti來實現，該卡和NVIDIA TITAN X的怪獸級性能勢必會對即將發布的Vega顯卡造成不小的壓力。究竟新Fury能不能戰平甚至戰過GTX 1080和GTX 1080 Ti?NVIDIA在下半年又會有著怎樣的動作?接下來的次世代旗艦之戰想必會非常精彩!

歡迎轉載：http://www.kanwencang.com/bangong/20170303/109538.html

文章列表