隨著 AI 推論需求暴增,記憶體儲存模式改變,輝達 (NVDA.US) 今 (6) 日也發表最新一代推論平台 NVIDIA BlueField-4 資料處理器,驅動推論情境記憶儲存平台 (NVIDIA Inference Context Memory Storage Platform),為全新一代 AI 原生儲存基礎架構,預計將在下半年上市。
包括營邦 (3693-TW)、Cloudian、DDN、戴爾科技集團、慧與科技、Hitachi Vantara、IBM、Nutanix、Pure Storage、Supermicro、VAST Data 與 WEKA 等創新的儲存公司,率先利用 BlueField-4 打造新一代 AI 儲存平台,並將於 2026 年下半年上市。
輝達指出,隨著 AI 模型擴展至數兆個參數與多步驟推理,產生大量情境資料,以鍵值 (KV) 快取表示,對準確性、使用者體驗與連續性至關重要。KV 快取無法長期儲存在 GPU 上,因為這會對多代理系統中的即時推論造成瓶頸。AI 原生應用需要全新類型的可擴充基礎架構,以儲存並分享這些資料。
輝達推論情境記憶儲存平台可擴展 GPU 記憶容量,實現節點間高速共享,將每秒處理的詞元數量提升多達 5 倍;相較於傳統儲存裝置,提供高達 5 倍的能源效率,可提供情境記憶體的基礎架構。
輝達創辦人暨執行長黃仁勳表示,AI 正在徹底革新整個運算堆疊,而現在輪到儲存空間。AI 不再僅是一次性使用的聊天機器人,而是智慧協作夥伴,能夠理解物理世界、進行長期推理、以事實為基礎、使用工具完成實際工作,並保留短期與長期記憶。透過 BlueField-4,NVIDIA 與軟硬體合作夥伴,正重新改造儲存堆疊,迎向 AI 的下一個前沿。
NVIDIA 推論情境記憶儲存平台可提升 KV 快取容量,並加速機架級 AI 系統叢集間的情境共享,同時多回合 AI 代理的持續情境可改善回應能力、提高 AI 工廠輸送量,並支援長情境、多代理推論的有效擴展。
NVIDIA BlueField-4 平台的主要功能包括,Rubin 叢集級 KV 快取容量,可提供長情境、多回合代理推論所需的規模與效率;相較於傳統儲存裝置,可將能源效率提升高達 5 倍。
此外,透過 NVIDIA DOCA 框架,可在 AI 節點間智慧加速 KV 快取共享,並與 NVIDIA NIXL 函式庫和 NVIDIA Dynamo 軟體緊密整合,可最大化每秒的詞元生成量、縮短首次生成詞元的時間,並改善多回合回應能力。
由 NVIDIA BlueField-4 管理的硬體加速 KV 快取放置,可消除詮釋資料 (metadata) 成本、減少資料移動,並確保從 GPU 節點的安全隔離存取。 NVIDIA Spectrum-X 乙太網路支援的高效資料共享與檢索,為基於 RDMA 的 AI 原生 KV 快取存取提供高效能的網路架構。
(美股為即時串流報價; OTC市場股票除外,資料延遲最少15分鐘。)新聞來源 (不包括新聞圖片): 鉅亨網