Meta押注AWS Graviton:數百萬顆ARM CPU支援代理人時代的AI運算
亞馬遜再以自有Graviton晶片取得大單,Meta簽約使用數百萬顆Graviton支援其AI運算。Graviton為ARM架構CPU非GPU,AWS表示最新版本針對AI推論與代理人負載優化。此交易使Meta部分雲端支出回流AWS,影響供應與競爭局勢。
Meta選擇AWS Graviton:用數百萬顆ARM CPU應對代理人時代
亞馬遜宣布與Meta達成協議,Meta將採用數百萬顆AWS Graviton晶片支援其人工智慧運算。
Graviton為ARM架構CPU而非GPU。雖然大型模型訓練仍以GPU為主,但代理人(agents)型應用帶來即時推理、寫程式與多步協調等密集運算,促使雲端業者強化CPU在推論與運行階段的角色。AWS表示其最新版本的Graviton已針對這類AI負載做優化。
這筆交易將部分Meta的雲端支出留在AWS,而非競爭對手如Google Cloud。先前Meta曾與Google Cloud簽署多年大額合約,現在的布局代表雲端供應與客戶關係出現新的拉鋸。亞馬遜同時也提供Trainium加速器,用於訓練與推論;此外,Anthropic已與AWS簽署長期使用協議,且獲得亞馬遜追加投資。
延伸閱讀
- Google TPUv8 雙晶片策略:TPU8t 訓練、TPU8i 推論與 Virgo/Boardfly 互連解析
- Thinking Machines與Google Cloud簽單位數十億美元合約,獲取Nvidia GB300運算資源以支援Tinker強化學習
- Cerebras申請IPO,以超大規模AI晶片搶攻訓練與推論市場
原始來源:TechCrunch
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。