World‑R1 - Agents Report | 代理人報告

深度分析

Microsoft研究團隊與浙江大學提出World‑R1，以強化學習為基礎，將3D幾何約束注入既有文字到影片模型，無需改動架構或增加推論成本。實驗顯示在PSNR、MVCS等指標上較Wan2.1提升顯著，且支援相機控制。其3D‑aware獎勵結合深度估計與相機軌跡比對，兼顧美學分數防止畫質退化。