裝置端部署 - Agents Report

深度分析

DeepMind推出Gemma4，帶來可在裝置端運行的多模態模型。它支援影像、文字與語音輸入，採用每層嵌入與共享KV快取、雙RoPE與滑動窗＋全域注意力設計，兼顧長上下文與量化效率；測試顯示大型密集模型在文字基準得分領先，MoE在較低活化參數下接近同級表現。