深度分析
UniRect‑CoT:利用自我校正提升統一多模態模型生成品質的免費午餐
統一多模態模型在理解上表現強勁,但生成能力不足。研究提出 UniRect‑CoT,透過反思式鏈式思考讓模型在擴散去噪時自我校正,激活內在知識。實驗顯示,套用此框架後,可顯著提升多任務生成品質,為多模態 AI 的成本與效能帶來新突破。
深度分析
統一多模態模型在理解上表現強勁,但生成能力不足。研究提出 UniRect‑CoT,透過反思式鏈式思考讓模型在擴散去噪時自我校正,激活內在知識。實驗顯示,套用此框架後,可顯著提升多任務生成品質,為多模態 AI 的成本與效能帶來新突破。
深度分析
擴散模型的後訓練常面臨 SFT 與 RL 之間的分布落差。研究者提出 SOAR,以單次停止梯度 rollout 重新加噪偏離狀態,並提供密集逐步監督,使模型自我校正回到乾淨目標。實驗顯示在 SD3.5-Medium 上,GenEval 從 0.70 提升至 0.78,OCR 從 0.64 提升至 0.67,且兼容後續 RL 對齊。