甲骨文 (ORCL-US) 宣布推出首個由輝達 (NVDA-US) Blackwell 平台加速的 zettascale 雲端運算集群,甲骨文雲端基礎架構 (OCI) 現已接受雲端最大 AI 超級電腦的訂單,這一電腦據稱將配備多達 131,072 個 Blackwell GPU,提供 2.4 zetaflops 的峰值效能。
甲骨文雲端基礎設施執行副總裁 Mahesh Thiagarajan 表示,公司擁有最廣泛的 AI 基礎設施產品之一,並為在雲端中運行一些最苛刻的 AI 工作負載的客戶提供支援。借助甲骨文的分散式雲,客戶可以靈活地在他們選擇的任何地方部署雲端和 AI 服務,同時保留最高水準的數據和 AI 主權。
甲骨文指出,OCI Supercluster 的最大規模提供的 GPU 數量是 Frontier 超級電腦的三倍多,是其他超大規模電腦的六倍多。 OCI Supercluster 包括 OCI 計算裸機、帶有 ConnectX-7 NIC 和 ConnectX-8 SuperNIC 的超低延遲 RoCEv2 或基於 NVIDIA Quantum-2 InfiniBand 的網絡,以及 HPC 儲存選擇。
公司稱,為了滿足不同客戶的需求,OCI 也設計了多種配置方案。從搭載 H100 GPU 的小型集群,到擴展至 65,536 塊 H200 GPU 的中型集群,再到最終形態的 Blackwell GPU 巨陣。
據甲骨文創辦人 Larry Ellison 近日透露,公司在全球範圍內已擁有 162 個營運中或在建的雲端資料中心,其中最大規模的資料中心容量已高達 800 兆瓦,並計畫進一步打造千兆瓦級別的資料中心,由創新的模組化核反應器提供綠色動力。
Nvidia Blackwell GPU 目前尚未上市,據報導 Nvidia 最近由於設計缺陷而暫停生產。 OCI 超集群預計將於 2025 年上半年實現。目前還不清楚 Oracle 是否已經從一開始就接受了最多 131,072 個 GPU 的訂單。