深度分析 DiffusionGemma:以擴散方式平行生成 256 Token,搭配 Gemma 4 MoE 與 FP8 加速本地推論 Google 於本週開源 DiffusionGemma,將擴散技術從影像生成延伸至文字生成。模型以 Gemma 4 為骨幹,採 26B MoE 架構,僅激活 3.8B 參數,支援在消費級 GPU 上本地推論。