NVIDIA於2026年GTC大會的重頭戲,即是嶄新的Vera Rubin加速運算平台,Vera Rubin不僅只是由CPU與GPU建構的系統,也成為由多機架模組建構的架構,並將Groq晶片納入生態系,成為7大晶片、5大機架模組構成的單一大型運算平台,同時宣布將推出Vera CPU機架模組。同時黃仁勳亦快速預覽預計在2NVIDIA於2026年GTC大會的重頭戲,即是嶄新的Vera Rubin加速運算平台,Vera Rubin不僅只是由CPU與GPU建構的系統,也成為由多機架模組建構的架構,並將Groq晶片納入生態系,成為7大晶片、5大機架模組構成的單一大型運算平台,同時宣布將推出Vera CPU機架模組。同時黃仁勳亦快速預覽預計在2

GTC 2026:NVIDIA公布Vera Rubin加速運算平台,納入包含Groq LPU等7大晶片、5大機架模組實現10年4億倍性能增長

2026/03/17 04:56
閱讀時長 11 分鐘
如需對本內容提供反饋或相關疑問,請通過郵箱 crypto.news@mexc.com 聯絡我們。

NVIDIA於2026年GTC大會的重頭戲,即是嶄新的Vera Rubin加速運算平台,Vera Rubin不僅只是由CPU與GPU建構的系統,也成為由多機架模組建構的架構,並將Groq晶片納入生態系,成為7大晶片、5大機架模組構成的單一大型運算平台,同時宣布將推出Vera CPU機架模組。同時黃仁勳亦快速預覽預計在2027年推出的Vera Rubin Ultra平台,帶出作為下一代Kyber機架系統Vera Rubin NVL144的Hyper Rack機架模組。

NVIDIA在正式介紹Vera Rubin之前,也回顧NVIDIA的DGX系統推出以來10年的發展歷程,從單一伺服器持續進化邁入POD設計,以及為了擴展性能納入越來越多的晶片與功能差異化,在10年內,DGX系統的性能足足增長4億倍。

▲Vera Rubin系統預計在2026年下半年推出

Vera Rubin系統預計於2026年下半年透過合作夥伴推出,包括Amazon Web Services、Google Cloud、Microsoft Azure以及Oracle Cloud Infrastructure等頂尖雲端服務商,以及NVIDIA雲端合作夥伴CoreWeave、Crusoe、Lambda、Nebius、Nscale和 Together AI等。

另外包括Cisco、Dell、HPE、聯想和美超微,以及Aivres、華碩、富士康、技嘉、英業達、和碩、雲達 QCT、緯創資通和緯穎Wiwynn等系統商預計推出基於Vera Rubin產品的各種伺服器。

Anthropic、Meta、Mistral AI與OpenAI等領先AI企業也正著手透過Vera Rubin訓練更為強大的模型,以及透過更低延遲的GPU與更低的推論成本提供長上下文、多模態服務。

7大晶片、6大機架建構新一代Vera Rubin NVL72系統

▲圖片左為Groq模組,中間為NVLink交換機模組,右為Vera Rubin模組

Vera Rubin由NVIDIA Vera CPU、NVIDIA Rubin GPU、NVIDIA NVLink 6 交換器、NVIDIA ConnectX - 9 超級網路卡、NVIDIA BlueField - 4 DPU、NVIDIA Spectrum-6 乙太網路交換晶片等NVIDIA全新開發的晶片以及全新加入生態系的Groq 3 LPU構成,以5種機架模組建構新一代Vera Rubin NVL72系統,並於單一系統涵蓋大規模預訓練、後訓練和測試擴展至即時智慧推論等功能。

突破Blackwell的性能及經濟效益

單一Vera Rubin NVL72機架由包含72個Rubin GPU晶片及36個Vera CPU晶片透過NVLink 6連接技術連接,同時配備ConnectX-9 SuperNIC以及BlueField-4 DPU,標榜僅需1/4的Blackwell GPU數量,即可實現10倍的每瓦推論性能以及把每Token成本降低至Blackwell世代的1/10。同時NVL72系統也是為大規模AI工廠系統建構所設計,可藉由NVIDIA Quantum-X800 InfiniBand與Spectrum-X乙太網路無縫擴展。

純CPU的Vera CPU機架

▲NVIDIA首次推出純CPU的機架系統,鎖定驗證GPU訓練之模型應用需求

過往於NVIDIA的DGX系統,CPU是緊密與GPU相互結合的運算模組的一部分,然而隨著新世代Vera CPU推出,NVIDIA也宣布純CPU的Vera CPU模組,旨在以CPU執行驗證於GPU作為強化學習與智慧AI工作負載的結果。此外NVIDIA也宣布有多家雲服務商、系統整合夥伴將推出Vera CPU機架系統。

Vera CPU機架基於NVIDIA MGX密集液冷基礎設施架構,在單一機架提供高達256個Vera CPU,機架系統亦整合Spectrum-X乙太網路,使得Vera CPU機架可與GPU機架協同工作,為大規模AI代理和強化學習提供CPU基礎架構,同時強調Vera CPU的效率是傳統CPU的兩倍,並提升50%的效能。

結合Groq LPU補強大規模推論實現天衣無縫的全能AI系統

▲Groq具備龐大的SRAM,可滿足AI代理系統對於低延遲、長上下文本需求

Vera Rubin平台另一個重點是將Groq LPU納入系統,進一步使NVIDIA系統增強大規模推論能力;Groq LPU是專為大規模推論最佳化的推論處理器,當Groq LPU與Vera Rubin結合後,可滿足AI代理系統對於低延遲、長上下文本的需求,並使每兆瓦推論性能提高35倍,萬億參數模型的推論收益可提高10倍。

▲Groq 3 LPU機架具備高達256個晶片與128GB的SRAM,並能與Vera Rubin NVL72結合執行協同運算

同時將Groq LPU進行大規模叢集部署時,可視為一個單一巨大晶片;單一個Groq LPU機架具備256個Groq處理器,並有高達128GB、達640GB/s可擴展頻寬的SRAM(不是RAM而是位於晶片前端SRAM!),當Groq LPU機架與Vera Rubin NVL72機架結合,Rubin及Groq可協同運算每個輸出標記的每一層AI模型,解碼速度更為提升。

黃仁勳也在台上提到,Vera Rubin系統所搭配的NVIDIA Groq LPU是由三星進行晶圓代工。

NVIDIA BlueField-4 STX儲存機架

此外,Vera Rubin平台也導入AI原生儲存系統NVIDIA BlueField-4 STX儲存機架,旨在將GPU的記憶體無縫擴展到整個POD系統;NVIDIA BlueField-4 STX由NVIDIA Vera CPU與NVIDIA ConnectX-9 SuperNIC構成的NVIDIA BlueField-4 作為基礎提供高頻寬共享層,針對存儲和檢索大型語言模型和AI代理工作產生的海量鍵值快取數據進行了最佳化。

NVIDIA也針對此AI原生儲存系統公布NVIDIA DOCA Memos,NVIDIA DOCA Memos是針對NVIDIA Bluefield-4最佳化的全新DOCA框架,支援專用的鍵值快取儲存處理,與通用儲存架構相比,可將推論吞吐量提升達5倍並提升能源效率;透過NVIDIA BlueField-4 STX儲存機架與DOCA Memos使上下文本可涵蓋整個POD範圍,實現與AI代理更快速的多輪互動、更具擴展性的AI服務以及更高的整體基礎設施利用率。

將能源管理納入生態的一環

NVIDIA執行長黃仁勳在日前闡述的AI如同五層蛋糕理論中也提到AI是能源是構成今日AI系統相當重要的環節,NVIDIA與200多家資料中心基礎架構合作夥伴合作公布NVIDIA DSX平台,當中包含可為AI工廠動態調度能源的DSX Max-Q,使固定功率資料中心可額外部署30% AI基礎設施,全新的DSX Flex則使AI工廠成為電網中的靈活資產,釋放100GW的閒置電網電力。

此外NVIDIA也同步推出Vera Rubin DSX AI Factory參考設計,Vera Rubin DSX AI Factory參考設計是由程式碼設計的AI基礎架構藍圖,透過將運算、網路、儲存、電源和冷卻緊密整合,可最大限度地提高每瓦的Token數和整體吞吐量,從而提高系統彈性並加快首次投入生產的時間。

展望Vera Rubin Ultra平台的Kyber機架

▲Kyber垂直刀鋒機架系統將隨Vera Rubin Ultra一起推出,採用全新的Hyper Rack設計▲這個龐大的模組並非運算模組,而是NVLink 7交換器模組

NVIDIA執行長黃仁勳也藉GTC 2026搶先展示下一代機架伺服器設計Kyber,Kyber是採用垂直刀鋒設計的新一代模組,透過全新Hyper Rack模組設計及散熱架構提高系統密度,並展示當中的Vera Rubin Ultra運算模組、中介模組與NVLink 7交換器模組,進一步將機架系統擴展至NVL144的規模,也為NVIDIA及合作夥伴實現更大規模的運算叢集願景。

市場機遇
Gitcoin 圖標
Gitcoin實時價格 (GTC)
$0.09294
$0.09294$0.09294
-2.72%
USD
Gitcoin (GTC) 實時價格圖表
免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 crypto.news@mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。