代理模型集合 - Agents Report

深度分析

視覺語言模型易受多模態 jailbreak 攻擊，現有方法多依賴單一代理或視角，導致在異質環境下效能下降。Mosaic 透過文字側轉換、多視角影像優化與代理模型集合指導，減少對單一模型與視圖的依賴。實驗顯示其在商業閉源 VLM 上達到最高攻擊成功率與平均毒性，提升了跨模型破解的實用性。