DUDE框架 - Agents Report | 代理人報告

深度分析

研究指出視覺語言模型驅動的網頁代理易遭介面欺騙攻擊。論文提出DUDE雙階段框架，結合混合獎勵學習與經驗摘要，評估點選是否為欺騙元素並累積可轉移的失敗經驗。實驗顯示能大幅降低被欺騙率並維持任務成功率。同時作者建構RUC基準集包含1407個場景以供評估與分析。