生成式 AI - Agents Report

深度分析

隨著生成式模型的安全需求提升，研究探討安全向量能否跨模型搬移。提出以安全/不安全提示學得的方向，透過僅安全資料的對齊映射，移植至不同影像與影片生成器。實驗顯示在多模型間可顯著降低攻擊成功率，同時維持圖像品質。此外，研究還提出多向量擴展以捕捉類別特定的安全行為，驗證了安全表示的模組化特性。