生成式擴散模型 - Agents Report

深度分析

以社交凝視一致性檢測生成式影像：針對去噪擴散模型與局部重繪的語義線索

在生成式模型逐步抹去低階偵測訊號的當下，研究提出「社交凝視一致性」作為一條高階語義偵測軸，聚焦多人人像中目光、頭眼對齊與瞳孔位置的互動一致性。作者透過配對編輯（只重繪眼周）、一套區塊式說明監督與跨架構驗證，證明此語義線索可跨生成器與不同骨幹遷移，於互動型子集上帶來可觀的平衡準確度提升，並指出這類語義線索將隨低階訊號消失而愈發重要。

以社交凝視一致性檢測生成式影像：針對去噪擴散模型與局部重繪的語義線索

Multi-ORFT：穩定線上強化微調的多代理擴散規劃技術