深度分析 ManimTrainer 與 ManimAgent:以 SFT+GRPO 結合 Renderer-in-the-loop 驅動 LLM 程式化動畫 研究針對以Manim從文字生成程式化動畫的挑戰,提出ManimTrainer結合監督微調與GRPO強化學習,以及ManimAgent的Renderer-in-the-loop與文件輔助推理策略,實驗顯示兩階段訓練與代理式推理互補,能顯著提升渲染成功率與視覺相似度。