深度分析
ValuePlanner:結合 LLM 與 PDDL 的價值驅動具身代理人框架
隨著具身AI逐漸突破感知瓶頸,研究提出ValuePlanner以LLM產生價值導向子目標,再由PDDL規劃器落實執行,實驗顯示其能在長期自主任務中協調衝突價值,產生更具一致性與多樣性的行為。此架構同時克服純神經模型的幻覺問題,並提供可驗證的行動計畫。
深度分析
隨著具身AI逐漸突破感知瓶頸,研究提出ValuePlanner以LLM產生價值導向子目標,再由PDDL規劃器落實執行,實驗顯示其能在長期自主任務中協調衝突價值,產生更具一致性與多樣性的行為。此架構同時克服純神經模型的幻覺問題,並提供可驗證的行動計畫。
深度分析
研究從傳統規劃的達成目標反向出發,將「不應出現的錯誤狀態」編成規劃目標。核心作法是列舉所有可導致錯誤的計畫,並以最小修改行為集的方式阻斷這些計畫;作者提出演算法 allmin,能以最少變更使規劃任務不可解。實驗顯示此方法能有效偵測並修補規劃任務中的缺陷,強化系統安全與穩定性。
深度分析
研究指出大型語言模型被用作機器人規劃器,但其安全性未獲系統性驗證。作者提出DESPITE基準,以PDDL符號化、完全確定性檢驗一萬二千二百七十九項任務,衡量可行性與安全意圖兩項能力。結果顯示,最佳模型雖幾乎不失敗,但仍產生近三成具危害性的計畫,提示安全意識成為部署關鍵。