深度分析
VLAA-GUI:以 Completeness Verifier 與 Loop Breaker 強化桌面 GUI 代理可靠性
桌面GUI代理仍面臨提前結束與重複循環兩大問題。VLAA-GUI以Completeness Verifier強制可觀察完成檢驗、Loop Breaker採多層過濾回復循環、Search Agent按需向LLM檢索流程知識。實驗於OSWorld與WindowsAgentArena上展現領先表現並提升可靠性。
深度分析
桌面GUI代理仍面臨提前結束與重複循環兩大問題。VLAA-GUI以Completeness Verifier強制可觀察完成檢驗、Loop Breaker採多層過濾回復循環、Search Agent按需向LLM檢索流程知識。實驗於OSWorld與WindowsAgentArena上展現領先表現並提升可靠性。
深度分析
本研究發現以截圖—點擊循環驅動的桌面 GUI 代理存在顯著的「觀測到執行」時間差(實驗平均 6.51 秒),形成可供未授權程式在 TOCTOU 窗口操作 UI 的攻擊面。作者形式化為「視覺原子性違反」,提出三種攻擊原語(通知覆蓋、視窗焦點操控、網頁 DOM 注入),並設計 DesktopTOCTOU-Bench 進行評測。