隨著2017年VR游戲和頭顯的普及,VR Ready顯卡市場需求量驟升,極大地刺激了上游芯片廠商的研發以及下游廠商的鋪貨。回顧過去的一年,Nvidia不僅優化了原先的開普勒架構,還一次次刷新單卡計算排行榜;AMD雖然依舊屈居第二,不過還是推出了RX 580和RX 570救場。乘此辭舊迎新之際,讓我們一起來回顧一下過去一年中VR Ready顯卡的發展,同時展望下一代的VR顯卡。
GTX 1060、GTX 1070和GTX 1080是2016年下半年到2017年上半年Nvidia在消費級市場上推出的VR-Ready級顯卡。GTX 1060定位VR入門級,GTX 1070定位進階VR級,而GTX 1080則定位高端VR體驗。雖然從字面上看GTX 1060定位VR入門級,不過在性能上已經超過前代GTX 970,性能直逼GTX 980。
GTX1060全新的GP-106核心擁有兩組GPC,每組有5個SMs(2×64個),共1280個CUDA處理器,剛好是GTX1080的一半。單精度浮點運算是4.4TFlops,相比GTX960的2.3T已經提升了近一倍,因此理論上性能應該可以翻倍。6個內存控制器,6×32-bit的顯存位寬共組成192-bit位寬,帕斯卡時代的6系卡回歸192bit也是相當喜聞樂見的。
GTX1060顯存升級到6GB,已經比GTX980的4G都更高,對于VR應用來說,大顯存相當有必要。流處理器數方面,GTX1070比GTX1080少了640個,1/4也就是一組的量,而GTX1060也是比GTX1070少了640個,剩1280了,但也比同定位的GTX960要多;顯存位寬終于回歸到192bit,位寬縮得太多一直是GTX960被噴的點。GTX1060基礎頻率也很高,1.5GHz比GTX960足足高了50%,加速頻率也達到了1.7GHz。GTX1060紋理單元和ROPs比GTX1070略為縮減,但減的都不是太多,這樣換來的是更低的功耗,僅120W,6PIN供電完全夠用!
面對英偉達的強勢入侵,AMD卻遲遲沒有做出回應,尤其是高端缺乏對應產品,只有Polaris北極星系列在中低端打拼。直到2017年7月30日,AMD才發布了三款Radeon Vega架構顯卡。
三款產品分別為RX Vega 64水冷版、RX Vega 64、RX Vega 56,蘇媽的Vega系列將對飆老黃的GTX 1080/1070,其中Vega 56表現尤其搶眼,各方面表現力壓GTX 1070,給后者造成了很大壓力。
Radeon RX VEGA 64采用14nm FinFET “VEGA 10”核心,集成了125億個晶體管,核心面積為486平方毫米。相比28nm工藝的上代大核心Fiji,VEGA 10的核心晶體管規模多了整整40%,面積卻縮小了18%。
基于全新VEGA架構的VEGA 10 XTX芯片共有4096個流處理器,運算單元數量為64個,TMUs總數量為256個,ROPs數量為64個,兩個帶寬為1024-bit的雙通道顯存控制器組成了總量為2048-bit的顯存控制單元,大小為8GB。
Radeon RX VEGA 56同樣采用14nm FinFET “VEGA 10”核心,基于全新VEGA架構的Vega 10 XT芯片共有3584個流處理器,運算單元數量為56個,TMUs總數量為144個,ROPs數量為32個,兩個帶寬為1024-bit的雙通道顯存控制器組成了總量為2048-bit的顯存控制單元,大小為8GB。
Radeon RX VEGA 64水冷版的默認核心頻率達到了1406MHz,Boost頻率高達1677MHz,有效頻率更是可以達到1750MHz,這個頻率是AMD顯卡史上的最高頻率。RX VEGA 64顯存帶寬為484 GB/s,默認Pixel Fillrate能力達到了98.9Gpiexls/S,默認Texture Fillrate能力為395.8Gtexels/S;RX Vega 56顯存帶寬為410 GB/s,默認Pixel Fillrate能力達到了94Gpiexls/S,默認Texture Fillrate能力為330Gtexels/S。
憑借高頻和龐大的運算規模,RX VEGA 64最高擁有13.7 TFLOPS的超高單精度浮點運算能力,照比上代R9 Fury X提升了59.3%,提升幅度相當驚人,是目前單芯顯卡中單精度浮點運算性能最強的。
Vega顯卡雖然規格夠高,讓A飯期待了一年多,但實際表現不盡如人意,現在就連基本的供貨都保證不了,HBM2依然是個痛。在這樣的情況下,Nvidia于秋季推出了GTX 1070 Ti。早前說它是用來對付AMD的RX Vega 56顯卡的,但NVIDIA并沒有什么必要出新品來對付Vega 56,市面上各種非公版GTX 1070顯卡就足夠了。
GTX 1070 Ti顯卡的規格明顯比GTX 1070顯卡高,實際上它更接近于GTX 1080,這三款顯卡都是基于16nm Pascal架構的GP104核心的,GTX 1080是完整版2560個CUDA核心,20組SM單元,GTX 1070 Ti是2432個CUDA核心,只砍了1組SM單元,CUDA數量明顯比1920個CUDA核心的GTX 1070高,所以這一次的閹割程度非常小。由于GTX 1070 Ti在性能上非常接近GTX 1080,為了保證自家產品線,官方限制了GTX 1070 Ti的超頻,市面上出售的GTX 1070 Ti均為公版。
在頂級顯卡方面依舊更迭不息,從Titan X到Titan Xp再到Titan V,Nvidia在高端計算方面一時風頭無二。雖然它嚴格來說是個半專業卡,不會大量上市,不像GTX系列那樣適合玩游戲,但畢竟代表著NVIDIA的頂級設計水準。
Titan V基于最高規格的GV100核心,集成211億個晶體管,擁有5120個CUDA核心、640個Tensor核心、320個紋理單元,核心頻率1200-1455MHz,單精度浮點性能15TFlops,同時搭配3072-bit 12GB BHM2顯存,等效頻率1.7GHz,帶寬653GB/s,熱設計功耗250W(8+6針供電)。
TITAN V采用12nm工藝的Volta核心打造,12GB HBM2顯存,5120流處理器,Tensor Cores為640。峰值浮點性能(特指深度學習)為110TFlops,是TITAN Xp(12T)的9倍。TITAN V要比GTX 1080Ti提升至少27%,它是一款比發燒級還發燒的顯卡。不過盡管如此,TITAN V仍然不是一款適合游戲玩家的顯卡。
高端顯卡象征了廠商在業界的頂級設計水平,雖然不會在短期內應用到民用級VR顯卡領域,不過象征著今后的主流發展方向。在2018年里,Nvidia還將推出能耗比更高的GTX 2000系顯卡,讓更多輕薄筆記本擁有VR-Ready級的計算性能。對于玩家來說,今后VR-Ready或將成為每一款顯卡的標配。