深度分析 DyBBT:結合多臂土匪與雙系統認知的動態平衡對話策略模型 任務導向對話系統的探索策略常因缺乏動態適應而效能受限。DyBBT 以認知狀態空間建模對話進程,並透過多臂土匪式元控制器在System1與System2間即時切換,提升探索效率。實驗證實其在成功率與泛化上達到業界最佳表現,顯示此技術可顯著改善對話系統的實用性。