深度分析 Mosaic:多視角集合優化破解閉源視覺語言模型的新框架 視覺語言模型易受多模態 jailbreak 攻擊,現有方法多依賴單一代理或視角,導致在異質環境下效能下降。Mosaic 透過文字側轉換、 多視角影像優化與代理模型集合指導,減少對單一模型與視圖的依賴。實驗顯示其在商業閉源 VLM 上達到最高攻擊成功率與平均毒性,提升了跨模型破解的實用性。