深度分析 DUDE:以混合獎勵與經驗摘要強化視覺語言模型對抗欺騙式介面 研究指出視覺語言模型驅動的網頁代理易遭介面欺騙攻擊。論文提出DUDE雙階段框架,結合混合獎勵學習與經驗摘要,評估點選是否為欺騙元素並累積可轉移的失敗經驗。實驗顯示能大幅降低被欺騙率並維持任務成功率。同時作者建構RUC基準集包含1407個場景以供評估與分析。