深度分析 Inverse Learning 與 Inverter 框架:以前向/逆向模型實現序列化決策與階層化規劃 本研究提出神經啟發的逆向學習(Inverse Learning, IL)框架,配對前向模型與逆向模型,分塊一次輸出多步動作。IL可透過整段序列優化產生平順、具全局軌跡結構的控制策略。實驗於多種迷宮與antmaze基準上,普遍超越離線RL與擴散規劃器,同時大幅降低推論耗時。