PLE

深度分析

Google DeepMind 在 Hugging Face 發布 Gemma 4 系列多模態模型，採 Apache 2 授權，支援文字、影像與部分音訊輸入，並以設計可在各種推理引擎和裝置上部署為目標。模型透過分層嵌入（PLE）、共享 KV 快取與雙 RoPE 配置，同時兼顧長上下文與量化效能；

深度分析

Google DeepMind 發表 Gemma 4 系列多模態模型，採 Apache 2 授權並支援文字、影像與部分音訊輸入，並強調可在多種推理引擎與平台上部署。架構採用分層嵌入（PLE）、共享 KV 快取與雙 RoPE 配置，兼顧長上下文與量化效能。