速報 VidCRAFT3:跨因素互動的可控影像到影片生成框架 VidCRAFT3 提出一套統一且彈性的影像到影片 (I2V) 生成系統,能同時控制相機運動、物件移動與光源方向,並明確考量視點、幾何與照明之間的物理耦合。系統結合 Image2Cloud 提供的 3D 幾何先驗、ObjMotionNet 的多尺度物件運動特徵,以及空間三重注意力變換器實現一致的重新照明。