多臂土匪 - Agents Report

深度分析

任務導向對話系統的探索策略常因缺乏動態適應而效能受限。DyBBT 以認知狀態空間建模對話進程，並透過多臂土匪式元控制器在System1與System2間即時切換，提升探索效率。實驗證實其在成功率與泛化上達到業界最佳表現，顯示此技術可顯著改善對話系統的實用性。