深度分析
以社交凝視一致性檢測生成式影像:針對去噪擴散模型與局部重繪的語義線索
在生成式模型逐步抹去低階偵測訊號的當下,研究提出「社交凝視一致性」作為一條高階語義偵測軸,聚焦多人人像中目光、頭眼對齊與瞳孔位置的互動一致性。作者透過配對編輯(只重繪眼周)、一套區塊式說明監督與跨架構驗證,證明此語義線索可跨生成器與不同骨幹遷移,於互動型子集上帶來可觀的平衡準確度提升,並指出這類語義線索將隨低階訊號消失而愈發重要。
深度分析
在生成式模型逐步抹去低階偵測訊號的當下,研究提出「社交凝視一致性」作為一條高階語義偵測軸,聚焦多人人像中目光、頭眼對齊與瞳孔位置的互動一致性。作者透過配對編輯(只重繪眼周)、一套區塊式說明監督與跨架構驗證,證明此語義線索可跨生成器與不同骨幹遷移,於互動型子集上帶來可觀的平衡準確度提升,並指出這類語義線索將隨低階訊號消失而愈發重要。
深度分析
閉環協同駕駛需產生多模式軌跡,研究提出Multi-ORFT結合場景條件化擴散預訓練與線上強化微調,採用自注意力與AdaLN‑Zero提升場景一致性,並以雙層MDP與VG‑GRPO穩定訓練。實驗顯示碰撞率與路外率均下降,速度提升,顯示該技術在安全與效率上具顯著優勢。