逆向學習 - Agents Report

深度分析

本研究提出神經啟發的逆向學習（Inverse Learning, IL）框架，配對前向模型與逆向模型，分塊一次輸出多步動作。IL可透過整段序列優化產生平順、具全局軌跡結構的控制策略。實驗於多種迷宮與antmaze基準上，普遍超越離線RL與擴散規劃器，同時大幅降低推論耗時。