NVIDIA 在 GTC 2026 大會揭露至 2028 年產品藍圖,Feynman 世代將導入 Rosa CPU、擴展光電融合架構,並整合 Groq 的 LP40 LPU,強化 AI 推論效能。
在GTC 2026大會上一口氣公布Vera Rubin平台細節、BlueField-4 STX儲存架構到太空運算等消息之後,NVIDIA執行長黃仁勳進一步揭露截至2028年的加速運算產品藍圖。這份藍圖不僅正式確認將持續整合Groq LPU設計,更指出「Feynman」次世代加速運算平台將進一步擴展光電融合架構,藉此增加更多AI推論所需傳輸頻寬。
Rubin世代納入Groq LPU,2027年推出Rubin Ultra
根據黃仁勳在GTC 2026大會中公布的最新架構藍圖,NVIDIA在與AI晶片新創公司Groq建立合作關係後,已正式將Groq的LPU (語言處理單元)正式納入其長期產品規劃。
按照規劃,預計於2026年下半年正式出貨的Vera Rubin平台,將會整合Groq的LP30 LPU,而在2027年預計推出的強化版本Rubin Ultra,則會整合LP35 LPU,其中將支援NVFP4精度,更預計在進入Feynman世代時,推進至LP40 LPU設計,並且藉由NVLink進行連接。
Feynman世代:堆疊式架構、客製化HBM設計、擴展光電並行網路架構
而在2028年預計推出的次世代架構Feynman,將會首度在裸晶 (Die)採堆疊設計,並且整合客製化HBM高頻寬記憶體,同時以NVLink技術與LP40 LPU連接,實現與GPU更有效率協作。
此外,Feynman世代也會加入名為Rosa的全新CPU,並且搭配下一代BlueField-5 DPU。而從Rubin世代開始將共同封装光學元件設計 (CPO)用於Spectrum 6 102T網路晶片之後,在Feynman世代將更進一步把共同封装光學元件設計用於NVLink 8 (第八代NVLink),以及下一款Spectrum 7 204T網路晶片,藉此對應更高資料傳輸頻寬,至於網路控制晶片也會更新至CX10。
不過,黃仁勳目前尚未透露Feynman世代是否也會比照Rubin世代額外推出Ultra規格,但預期也會有類似產品規劃,藉此符合先前預告每年一更的產品發展策略。
機架策略轉向:Operon與Kyber並行,後者將扛下超大規模擴展重任
至於在機架系統的規劃方面,NVIDIA也確立了未來的雙軌並行策略。根據藍圖,隨著預計於2027年問世的Kyber機架系統即將到來,NVIDIA 的機架級產品線將進行策略性分工。
黃仁勳確認,屆時將維持現行Operon機架系統與新一代Kyber機架系統並行的策略。而在2028年推出的Feynman世代,Kyber系統將接替Operon成為超大規模擴展的主要設計,預計從Rubin世代可達NV144規模,在Feynman世代一口氣擴展至NVL1152規模,藉此對應未來更高的AI工廠運算密度。
分析觀點:NVIDIA 的「系統級戰爭」與競爭對手的追趕難題
NVIDIA在GTC 2026釋出的這份產品藍圖,其戰略意義遠超單純的晶片規格升級,更象徵NVIDIA的競爭維度正式從「晶片對晶片」的軍備競賽,升級為「系統對系統」的總體戰爭。
首先,收編Groq技術的戰略意圖清晰可見,主要藉由Groq的LPU技術補齊自身在AI推論階段的不足 (相比訓練的加速運算,推論往往需要更敏捷且不過度耗費電力等成本的運算特性),藉此提供從訓練到推論的無縫體驗,對於市場接下來更龐大的代理式AI應用需求極為重要。
其次,Feynman世代預告擴展的光電融合架構,將是NVIDIA下一個十年的關鍵護城河,不僅藉由自身GPU加速運算優勢持續提高AI模型訓練效率,此次更藉由Groq的LPU強化推論效益,甚至更進一步透過光電融合實現整體算力規模向外擴展 (Scale-out),同時也讓博通 (Broadcom)在共封裝光學設計應用佈局面臨競爭壓力。


