
AMD的CEO蘇姿豐
AMD周四公布了其下一代 AI 芯片 Instinct MI400 系列的新細節,該系列芯片將于明年出貨。
AMD 稱,MI400 芯片可組裝成名為 Helios 的完整服務器機架,這使得數千個芯片能夠以 “機架級” 系統的形式連接在一起。
“我們首次將機架的每個部分設計為一個統一系統,”AMD 首席執行官蘇姿豐周四在加利福尼亞州圣何塞的發布活動上表示。
OpenAI 首席執行官山姆・奧特曼與蘇姿豐一同登臺,并表示其公司將使用 AMD 芯片。
“當你第一次告訴我這些規格時,我心想,這不可能,聽起來太瘋狂了,” 奧特曼說,“這將是一件了不起的事情。”
AMD 的機架級設置將使芯片對用戶而言像一個統一系統,這對大多數 AI 客戶(如云服務提供商和開發大型語言模型的公司)至關重要。這些客戶需要覆蓋整個數據中心并消耗大量電力的 “超大規模” AI 計算機集群。
“可以將 Helios 視為一個真正像單個大型計算引擎一樣運作的機架,” 蘇姿豐將其與英偉達預計明年發布的 Vera Rubin 機架進行了對比。
OpenAI 首席執行官山姆・奧特曼
AMD 的機架級技術還使其最新芯片能夠與英偉達的 Blackwell 芯片競爭,后者已配置 72 個圖形處理單元(GPU)。英偉達是 AMD 在開發和部署 AI 應用的大型數據中心 GPU 領域的主要且唯一競爭對手。
AMD 稱,作為英偉達的重要客戶,OpenAI 一直在為其 MI400 路線圖提供反饋。借助 MI400 芯片和今年的 MI355X 芯片,AMD 計劃在價格上與競爭對手英偉達展開競爭。該公司一位高管周三對記者表示,由于功耗更低,這些芯片的運行成本將更低,且 AMD 正以 “激進” 的價格削弱英偉達的市場份額。
到目前為止,英偉達在數據中心 GPU 市場占據主導地位,部分原因在于它是首家開發出 AI 開發者所需軟件的公司,這些軟件可讓原本為 3D 游戲顯示圖形而設計的芯片發揮作用。在過去十年 AI 熱潮之前,AMD 專注于在服務器 CPU 領域與英特爾競爭。
蘇姿豐表示,盡管英偉達使用其 “專有” CUDA 軟件,AMD 的 MI355X 仍可超越英偉達的 Blackwell 芯片。
“這表明我們擁有真正強大的硬件,這是我們一直知道的,但也表明開源軟件框架取得了巨大進步,” 蘇姿豐說。
2025 年迄今為止,AMD 股價持平,這表明華爾街尚未將其視為對英偉達主導地位的重大威脅。
AMD “Helios” AI 機架。
AMD 數據中心 GPU 總經理安德魯・迪克曼(Andrew Dieckmann)周三表示,AMD 的 AI 芯片將在運行成本和購置成本上更低。
“總體而言,我們在價格上有顯著優勢,再加上我們的性能競爭優勢,因此能節省相當可觀的兩位數百分比成本,” 迪克曼說。
未來幾年,大型云公司和各國都準備斥資數千億美元圍繞 GPU 建造新的數據中心集群,以加速前沿 AI 模型的開發。僅今年,大型科技公司的計劃資本支出就包括 3000 億美元。
AMD 預計到 2028 年 AI 芯片總市場規模將超過 5000 億美元,盡管尚未說明其能占據多少市場份額 —— 據分析師估計,英偉達目前占據超過 90% 的市場份額。
兩家公司都承諾每年發布新的 AI 芯片,而非每兩年一次,這凸顯了競爭的激烈程度,以及尖端 AI 芯片技術對微軟、甲骨文和亞馬遜等公司的重要性。
蘇姿豐稱,AMD 在過去一年收購或投資了 25 家 AI 公司,包括今年早些時候收購服務器制造商 ZT Systems,該公司開發了 AMD 構建機架規模系統所需的技術。
“這些 AI 系統變得極其復雜,全棧解決方案確實至關重要,” 蘇姿豐說。
AMD 當前的銷售情況
目前,云服務提供商正在安裝的最先進的 AMD AI 芯片是其 Instinct MI355X,該公司稱其已于上月開始批量出貨。AMD 表示,從第三季度開始,云服務提供商將可租用該芯片。
為 AI 構建大型數據中心集群的公司希望有英偉達的替代方案,不僅是為了降低成本和提供靈活性,還為了滿足對 “推理”(即實際部署聊天機器人(16.720, 0.19, 1.15%)或生成式 AI 應用所需的計算能力)日益增長的需求,這比傳統服務器應用需要更多的處理能力。
“真正改變的是對推理的需求顯著增長,” 蘇姿豐說。
AMD 官員周四表示,他們認為其新芯片在推理方面優于英偉達的芯片。這是因為 AMD 的芯片配備了更多高速內存,使更大的 AI 模型能夠在單個 GPU 上運行。
AMD 稱,MI355X 的計算能力是其前身的七倍。這些芯片將能夠與英偉達去年年底開始出貨的 B100 和 B200 芯片競爭。
AMD 表示,其 Instinct 芯片已被 10 大 AI 客戶中的 7 家采用,包括 OpenAI、特斯拉、xAI 和 Cohere。
AMD 稱,甲骨文計劃向其客戶提供包含超過 13.1 萬個 MI355X 芯片的集群。
Meta 官員周四表示,他們正在使用 AMD 的 CPU 和 GPU 集群來運行其 Llama 模型的推理,并計劃購買 AMD 的下一代服務器。
微軟代表表示,其使用 AMD 芯片為其 Copilot AI 功能提供服務。
價格競爭
AMD 拒絕透露其芯片的成本 —— 它不單獨銷售芯片,最終用戶通常通過戴爾或超微電腦等硬件公司購買 —— 但該公司計劃讓 MI400 芯片在價格上競爭。
這家位于圣克拉拉的公司將其 GPU 與 2022 年收購 Pensando 獲得的 CPU 和網絡芯片搭配,以構建其 Helios 機架。這意味著其 AI 芯片的更廣泛采用也將惠及 AMD 的其他業務。與英偉達的專有 NVLink 不同,它還使用名為 UALink 的開源網絡技術來緊密集成其機架系統。
AMD 聲稱,其 MI355X 每美元可提供比英偉達芯片多 40% 的代幣(一種 AI 輸出的衡量標準),因為其芯片比競爭對手的功耗更低。
數據中心 GPU 每顆芯片可能耗資數萬美元,云公司通常會大量購買。
AMD 的 AI 芯片業務仍遠小于英偉達。該公司表示,其 2024 財年 AI 銷售額為 50 億美元,但摩根大通分析師預計該類別今年將增長 60%。