深度分析
DiffusionGemma:以擴散方式平行生成 256 Token,搭配 Gemma 4 MoE 與 FP8 加速本地推論
Google 於本週開源 DiffusionGemma,將擴散技術從影像生成延伸至文字生成。模型以 Gemma 4 為骨幹,採 26B MoE 架構,僅激活 3.8B 參數,支援在消費級 GPU 上本地推論。
深度分析
Google 於本週開源 DiffusionGemma,將擴散技術從影像生成延伸至文字生成。模型以 Gemma 4 為骨幹,採 26B MoE 架構,僅激活 3.8B 參數,支援在消費級 GPU 上本地推論。
大佬動態
Simon Willison 報導 Google 先前的 Gemini Diffusion 實驗模型已以 Apache 2 授權的 DiffusionGemma-26B-A4B-it 形式開源。NVIDIA 在 NIM 雲端 API 免費提供此模型,測試產生 2,409 token 僅需 4.4 秒,約 500 token/秒。此開源與即時可用的安排將促進生成式 AI 圖像與多模態研發。