在北京時間今天上午舉行的GTC(GPUTechnoglogyConference)2018日本站上,英偉達首席執(zhí)行官黃仁勛介紹了該公司在AI方面的最新進展,宣布了一系列新產(chǎn)品,其中包括NVIDIATensorRT超大規(guī)模平臺、NVIDIADriveAGXXavier開發(fā)套件以及JetsonAGXXavier開發(fā)套件等。現(xiàn)場還補充介紹了英偉達于不久前分別發(fā)布的新QuadroRTX和新GeforceRTX。
據(jù)介紹,富士公司(FUJIFILM)成為日本第一家采用NVIDIADGX-2AI超級計算機的公司,它將用于加速醫(yī)療保健和醫(yī)療成像系統(tǒng)等領(lǐng)域的AI技術(shù)的開發(fā),以及用于顯示器的高功能材料等。
英偉達在本次GTC2018日本站上宣布的新產(chǎn)品具體有:
NVIDIATensorRT超大規(guī)模平臺
英偉達今天推出了一個全新的人工智能數(shù)據(jù)中心平臺——TensorRT超大規(guī)模平臺,能夠為語音、視頻、圖像和推薦服務提供推理加速解決方案。
該平臺可為端到端應用提供最快性能和更低延遲,使超大規(guī)模數(shù)據(jù)中心能夠提供新的服務,例如增強型自然語言交互,以及對搜索查詢的給出直接答案而非模糊匹配的一系列結(jié)果。處理查詢的速度比僅采用CPU時快40倍。
NVIDIA預計AI推理行業(yè)有望在未來五年內(nèi)平穩(wěn)增長至200億美元的市場。
NVIDIATensorRT超大規(guī)模平臺包括一整套硬件和軟件產(chǎn)品,這些產(chǎn)品針對強大、高效的推理進行了優(yōu)化。關(guān)鍵要素包括:
NVIDIATeslaT4GPU——搭載320個TuringTensorCore和2560個CUDACore,這款全新GPU具有突破性的性能,以及靈活的多精度功能,從FP32到FP16再到INT8及INT4。它采用高能效的75瓦小型PCIe封裝,可輕松適用于大多數(shù)服務器。FP16的峰值性能為65teraflops,INT8為130teraflops,INT4為260teraflops。
NVIDIATensorRT5——推理優(yōu)化器和運行時引擎,NVIDIATensorRT5支持TuringTensorCore,并對適用于多精度工作負載的神經(jīng)網(wǎng)絡(luò)優(yōu)化集進行了擴展。
NVIDIATensorRT推理服務器——這一容器化的微服務軟件使應用能夠在數(shù)據(jù)中心生產(chǎn)中采用AI模型。其在NVIDIAGPUCloud容器注冊中免費提供,可實現(xiàn)數(shù)據(jù)中心吞吐量和GPU利用率的最大化,支持所有常用AI模型和框架,并集成了Kubernetes和Docker。
NVIDIAAGX系列
英偉達今天還宣布了其AGX陣容,這是英偉達基于Xavier的產(chǎn)品系列的新名稱,這些產(chǎn)品專為從機器人到自動駕駛汽車的自動機器系統(tǒng)而設(shè)計,嵌入了AIHPC。
今天推出的是NvidiaDriveAGXXavier開發(fā)套件,這是一個用于構(gòu)建自動駕駛系統(tǒng)的平臺。這種開放、可擴展的軟件和硬件解決方案使公司能夠無縫地開發(fā)和測試定制的自動駕駛技術(shù),簡化生產(chǎn)。
Nvidia還提供類似的Clara平臺,專為醫(yī)療應用而設(shè)計,作為疾病早期檢測、診斷和治療的新工具。
JetsonAGXXavier開發(fā)套件
英偉達今天宣布推出JetsonAGXXavier開發(fā)套件,部分日本的工業(yè)和制造商率先開始使用該新系統(tǒng)。
作為世界上第一臺為人工智能,機器人和邊緣計算而創(chuàng)建的計算機,JetsonAGXXavier的大規(guī)模計算性能可以處理對下一代機器人至關(guān)重要的測距、定位、測繪、視覺和感知以及路徑規(guī)劃。
同時黃仁勛在今天GTC大會上介紹到,雅馬哈汽車公司將選擇NVIDIAJetsonAGXXavier作為開發(fā)系統(tǒng),為其即將推出的自動機器系列提供動力。