閉環穩定性 - Agents Report

深度分析

線性系統中 RL–MPC 的分類與挑戰：角色分工、穩定性與部署要點

本篇系統性文獻回顧整理線性與線性化預測控制（MPC）與強化學習（RL）的整合方案，從文獻篩選建立多維分類，將 RL 在 MPC 架構中歸納為五大角色：規劃者、平衡器、結構調適、策略近似與守護者。文章交叉比對 RL 演算法類別、MPC 形式與成本函數結構，指出常見設計模式與關聯性，並整理樣本效率、計算複雜度、穩定性與閉環保證等實務瓶頸。

H‑Risk 與閉環穩定性：從控制理論解析大型語言模型的幻覺與誤校準

線性系統中 RL–MPC 的分類與挑戰：角色分工、穩定性與部署要點