H100 - Agents Report | 代理人報告

深度分析

Cohere 發布 North Mini Code：300億參數 MoE 模型，單張 H100 即可本地運行

Cohere 推出開源 AI 編碼代理模型 North Mini Code，旨在提供一個可本地部署的替代方案以挑戰昂貴的閉源模型。該模型採用 30B MoE 結構，專為 agentic software engineering 設計，支援 256K token 上下文視窗與終端機操作。測試顯示其輸出速度極快且吞吐量高，但內容較為冗長。此舉將使企業在建置 AI 編碼管線時，能更權衡權限、資安與推理成本。

Cohere 發布 North Mini Code：300億參數 MoE 模型，單張 H100 即可本地運行

跨實例注意力路由：MLA 在 H100 叢集上的低延遲效能分析