H‑Risk
H‑Risk 與閉環穩定性:從控制理論解析大型語言模型的幻覺與誤校準
研究從控制理論角度檢視幻覺現象,將康德認知架構比作反饋穩定機制。作者提出H‑Risk複合指標衡量閉環條件數與靈敏度,並在線性高斯系統與大型語言模型實驗中發現:結構性脆弱會導致過度自信和錯誤產生,對校準與幻覺診斷具實務啟示。並指向可選擇性降低過度自信的診斷與修正方向。
H‑Risk
研究從控制理論角度檢視幻覺現象,將康德認知架構比作反饋穩定機制。作者提出H‑Risk複合指標衡量閉環條件數與靈敏度,並在線性高斯系統與大型語言模型實驗中發現:結構性脆弱會導致過度自信和錯誤產生,對校準與幻覺診斷具實務啟示。並指向可選擇性降低過度自信的診斷與修正方向。
深度分析
本篇系統性文獻回顧整理線性與線性化預測控制(MPC)與強化學習(RL)的整合方案,從文獻篩選建立多維分類,將 RL 在 MPC 架構中歸納為五大角色:規劃者、平衡器、結構調適、策略近似與守護者。文章交叉比對 RL 演算法類別、MPC 形式與成本函數結構,指出常見設計模式與關聯性,並整理樣本效率、計算複雜度、穩定性與閉環保證等實務瓶頸。