深度分析 安全向量驅動的生成式 AI 跨模型控制:降低 30%~50% 攻擊成功率 隨著生成式模型的安全需求提升,研究探討安全向量能否跨模型搬移。提出以安全/不安全提示學得的方向,透過僅安全資料的對齊映射,移植至不同影像與影片生成器。實驗顯示在多模型間可顯著降低攻擊成功率,同時維持圖像品質。此外,研究還提出多向量擴展以捕捉類別特定的安全行為,驗證了安全表示的模組化特性。