從早期的游戲繪圖架構公司起家的英偉達,在游戲繪圖對圖像精度和還原度要求日益提高的時代下,已經轉為計算架構公司了,“架構”業務的內涵也隨之加大了芯片研發的比重。
繪圖架構雖然在近兩年并未出現質變級提升,但日前的GTC 2018上還是發布了RTX(ray-tracing)實時光線追蹤技術,在內容創作者或傳媒業可大幅提高渲染速度和質量,還能創建最為逼真的3D可視化模型。雖然業務重點和大會的重頭戲還是芯片和系統平臺的發布,但可真實模擬現實場景、甚至達到電影大片圖像效果的該技術勢必成為圖像處理的一次變革。
言歸正傳,回到計算架構的主題,此次英偉達發布的GPU、處理軟件和系統平臺眾多,共同特點都是主打高性能、高速處理,并且突出與其他終端的互聯,打造開放架構。
GPU可以比CPU更高效、更穩定完成海量數據處理任務,并行計算讓傳統的處理方式得到顯著提升,高效處理所節省的時間和物力成本遠遠超過部署GPU所投入的成本,而且還能提供更優質的用戶體驗,不論是對服務供應商還是對直接用戶來說都是一舉兩得。因此,在大會上,也拋出了“GPU用得越多,節省的成本也越多”的口號。
單獨GPU性能不斷提升之后,行業需求也日益復雜和多元,這是如果能串聯多個GPU,形成更大的GPU集合、創造更高效的處理流程,這將會是未來GPU提升服務能力的關鍵。
為此,英偉達此次也推出了“NVSwitch”架構,在同時發布的DXG-2server中互聯了16顆GPU,采用了全新的交換器結構后的互聯設計在單一結構中實現了2PETAFLOP的最高效能。而且只需要2000W的功耗。高效能、低功耗意味著低成本,降低用戶負擔,為商業量產和推廣助力,還可處理最大規模的數據集和最復雜的深度學習模型。
集群多個GPU使單一架構提升效能,而在萬物互聯、布局無人駕駛時代下,將其搭載到更多終端設備是下一步重點。
為此,英偉達此次重磅和ARM聯合,宣布將共同打造IOT設備的AI芯片專用IP,這款機器學習IP集成到ARM的ProjectTrillium平臺上,以實現機器學習,這項技術源于英偉達Xavier芯片以及去年開源的DLA深度學習加速器項目。
同時,基于自主機器系統級芯片 NVIDIA Xavier設計,同時推出了“NVDLA”免費開放式架構,旨在推廣設計深度學習推理加速器的標準方法。據了解,NVDLA 的模塊化架構具有可擴展性和高度可配置性,專門為簡化集成和便攜性而設計。
游戲、繪圖行業的用戶現在已不是最新架構和芯片的主要用戶,畢竟開發成本擺在那里,只有頂級商家和極少數玩家才會對此買賬。所以,必需要將人工智能能力深入到關卡設計、玩家角色定位、生態、產業每個環節,讓人工智能模塊與游戲應用和管理模塊更好融合,為玩家提供浸入式親臨其境的體驗,讓廣大普通玩家認可AI的效果和能力,最終才能讓繪圖芯片廠商和游戲開發商更多應用AI模塊。
面對芯片行業AMD、微軟等巨頭的挑戰,架構少有突破型升級的英偉達也在合作伙伴和自身生態圈上下足功夫,于是GTC 2018就推出了GEForce伙伴計劃,讓企業和游戲玩家之間更加透明,共同生長的同時也牢牢吸引了一眾用戶,也有媒體評論認為此舉頗有建立行業壟斷之嫌,在這里我們真誠希望的是更多架構能夠服務于醫療、自動駕駛、金融科技等領域。
對此,也推出了DRIVEConstellation自動駕駛仿真系統,這是一款基于兩種不同服務器的計算平臺。第一臺服務器運行 NVIDIA DRIVE Sim 軟件,用以模擬自動駕駛汽車的傳感器,如攝像頭、激光雷達和雷達。
第二臺服務器搭載了NVIDIADRIVE Pegasus AI 汽車計算平臺,可運行完整的自動駕駛汽車軟件堆棧,并能夠處理模擬數據,這些模擬數據如同來自路面行駛汽車上的傳感器。
計算架構驅動了芯片性能的多次升級,得以完成更高難度和級別的深度學習,不斷優化模型。反過來,逐漸提高的人工智能能力也催生了芯片行業的更多市場需求,讓高性能的GPU不斷涌現,賦能更多場景,讓人工智能產業更加繁榮。