深度分析 World‑R1:以強化學習注入 3D 幾何一致性的文字到影片生成框架 Microsoft研究團隊與浙江大學提出World‑R1,以強化學習為基礎,將3D幾何約束注入既有文字到影片模型,無需改動架構或增加推論成本。實驗顯示在PSNR、MVCS等指標上較Wan2.1提升顯著,且支援相機控制。其3D‑aware獎勵結合深度估計與相機軌跡比對,兼顧美學分數防止畫質退化。