NVIDIA 發表 Vera CPU,定位為代理式 AI 的協調中樞。藉由 NVLink-C2C 與 GPU 深度整合,專職處理複雜的邏輯與規劃任務,達成效能倍增、功耗減半的目標,重塑 CPU 於 AI 基礎設施中的核心角色。NVIDIA 發表 Vera CPU,定位為代理式 AI 的協調中樞。藉由 NVLink-C2C 與 GPU 深度整合,專職處理複雜的邏輯與規劃任務,達成效能倍增、功耗減半的目標,重塑 CPU 於 AI 基礎設施中的核心角色。

GTC 2026:NVIDIA 推出 Vera CPU 專為代理式 AI 設計

2026/03/17 13:25
閱讀時長 10 分鐘
如需對本內容提供反饋或相關疑問,請通過郵箱 crypto.news@mexc.com 聯絡我們。

NVIDIA 在 GTC 2026 發表 Vera CPU,標榜為全球首款專為代理式 AI 設計的處理器,搭載 88 個自主設計核心,相比傳統伺服器 CPU 效能提升兩倍、功耗降低一半。
在GTC 2026上,NVIDIA不僅發表完整的Vera Rubin平台,更同步推出該平台的核心大腦——Vera CPU。這款處理器被官方定義為「世界上第一款專為代理式AI和強化學習時代設計的處理器」,標誌著CPU在AI運算中的角色發生根本性轉變。

CPU不再是配角:代理式AI的「指揮中樞」

隨著AI從單純的模型運算走向能夠推理和行動的「代理」,負責協調這些工作的系統重要性急遽上升。NVIDIA執行長黃仁勳表示:「CPU不再只是單純地支持模型,而是正在驅動模型。憑藉突破性的效能和能源效率,Vera 解鎖了能思考得更快、擴展得更遠的AI系統」。

Vera CPU的設計目標非常明確:處理代理式AI背後複雜的邏輯任務。當GPU負責大規模平行運算時,Vera負責運行那些「思考」的工作——規劃任務、執行工具、與資料庫互動、執行程式碼、驗證結果。與傳統機架級CPU相比,Vera CPU在執行這類工作時,結果產出效率提升兩倍,速度快50%。

技術規格:專為AI優化的「類CPU」架構

Vera CPU採用88個NVIDIA自行設計的「Olympus」核心,專為編譯器、運行時引擎、分析管線、代理工具和編排服務提供高效能。每個核心都能透過NVIDIA的空間多執行緒技術同時運行兩個任務,適合在同時運行多個任務的多租戶AI工廠環境中,提供穩定且可預測的效能。

在記憶體子系統方面,Vera搭載第二代低功耗記憶體架構,基於LPDDR5X記憶體,提供高達1.2 TB/s的資料傳輸頻寬,是一般用途CPU頻寬的兩倍,但功耗僅為一半,完美呈現「效能翻倍、能耗砍半」的設計理念。

與GPU的無縫協作:NVLink-C2C成關鍵

作為Vera Rubin平台的一部分,Vera CPU透過NVIDIA NVLink-C2C互連技術與Rubin GPU配對,提供高達1.8 TB/s的一致性傳輸頻寬,是PCIe Gen 6頻寬的7倍。這種超高頻寬的緊密耦合,讓CPU和GPU之間的資料共享達到前所未有的速度,對於需要即時協作的代理式AI工作負載極為重要。

除了整合進NVL72機架,Vera CPU也能用於NVIDIA HGX Rubin NVL8系統的主機,負責協調GPU加速工作負載的資料移動與系統控制。

生態系與應用實例:從科學計算到即時串流

Vera CPU已經獲得廣泛的產業支持。雲端服務商如阿里巴巴、字節跳動、CoreWeave、Meta、Oracle Cloud Infrastructure等都計劃導入使用。系統合作夥伴則涵蓋Dell、HPE、聯想、Supermicro,以及華碩、富士康、技嘉、廣達、緯創等台灣廠商。

具體應用案例也展現Vera CPU的潛力:

• AI程式設計工具Cursor將採用Vera CPU提升其AI編碼代理的整體吞吐量和效率,為用戶提供更快速、更靈敏的體驗。

• 即時資料平台Redpanda測試發現,運行Apache Kafka相容工作負載時,Vera CPU的延遲比他們測試過的其他系統低5.5倍。

• 德州先進運算中心 (TACC)在測試Vera CPU平台後表示,其每核心效能和記憶體頻寬代表科學計算的巨大飛躍,計劃在今年稍晚於其「Horizon」系統中Vera CPU節點。

分析觀點:NVIDIA的「總體戰爭」與CPU市場的重新洗牌

NVIDIA在GTC 2026具體公布的Vera Rubin平台,其戰略意義遠超任何一款單一晶片,其象徵NVIDIA從「顯示卡公司」向「全端式AI基礎設施霸主」的終極進化。

首先,這是對「代理式AI」基礎設施需求的精準卡位。當業界還在熱議AI代理的應用場景時,NVIDIA已經著手解決其背後最頭痛的工程難題:如何協調數以萬計的CPU環境來驗證GPU產生的結果?如何管理百萬token級別的上下文記憶體?Vera Rubin平台給出的答案是:將CPU、GPU、網路、儲存全部重新設計,並且透過NVLink和Spectrum網路將其融合成一台巨大的虛擬電腦,讓想要打造大規模AI代理服務的企業,幾乎沒有理由不選擇這個「開箱即用」的完整方案。

其次,Vera CPU的問世,則是對傳統CPU巨頭英特爾和AMD的正面突襲。雖然NVIDIA強調Vera CPU是「專為AI設計」,但其高單核效能、驚人的記憶體頻寬,以及與GPU的無縫整合,將對傳統的通用伺服器CPU市場產生強烈衝擊。

特別是當AI工廠需要大規模佈署純CPU環境來進行強化學習時,Vera CPU提供的「兩倍效率、一半功耗」將成為極具說服力的採購導入理由。這不僅是搶奪市佔率,更是重新定義「AI時代的CPU應該長什麼樣子」。

再者,整合Groq的LPU,則是將其極低的推論延遲特性納入NVIDIA機架設計方案,並且與Rubin GPU共同運算,等於是在NVIDIA的龐大加速運算體系內,為「超低延遲推論」這個細分市場提供更好解決方案,不僅能吸引對延遲極度敏感的金融交易或即時AI代理應用,更向市場展示NVIDIA生態的開放性與包容性。

然而,這場盛宴的背後也存在隱憂。如此高度整合的「系統級解決方案」,將不可避免地帶來更高的採購單價與供應商鎖定效應。客戶過去可以自由搭配不同品牌的CPU、GPU和網路設備,但在Vera Rubin的世界裡,若要獲得最佳效能,意味必須全套採用NVIDIA的設計方案。雖然這對NVIDIA的營收和利潤帶來巨大成長推力,但也可能引發部分大型雲端業者如AWS、Google更進一步加速自研晶片的步伐,以求在未來掌握更多市場議價權與技術自主性。

資料來源

  • https://mashdigi.com/nvidia-unveils-vera-cpu-designed-specifically-for-agent-based-ai-doubles-performance-and-halves-power-consumption-redefining-the-role-of-the-cpu-in-the-ai-factory/
市場機遇
Gitcoin 圖標
Gitcoin實時價格 (GTC)
$0.09105
$0.09105$0.09105
-4.69%
USD
Gitcoin (GTC) 實時價格圖表
免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 crypto.news@mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。