跨平台部署 - Agents Report

深度分析

Gemma 4：Google DeepMind 多模態模型上線 Hugging Face 與技術規格解析

Gemma 4 為 Google DeepMind 於 2026 年推出的多模態模型，支援圖像、文字與音訊輸入，且以 Apache 2.0 授權公開。模型結合滑動窗口與全局注意力、雙 RoPE、層級嵌入與共享 KV 快取，提升長上下文與量化效能。測試顯示 31B 版在 LMArena 基準得分 1452，MoE 版以 4B 活化參數即達 1441，並在 OCR、物件偵測與影片理解等任務表現優異。

OpenEnv：以 Gymnasium API 為核心的開源代理式強化學習平台與跨平台治理

Gemma 4：Google DeepMind 多模態模型上線 Hugging Face 與技術規格解析