PDDL - Agents Report | 代理人報告

深度分析

i-EXAM：結合規劃編譯、Top‑k 規劃與 LLM 的可說明攻擊圖分析平台

隨著大型網路安全需求提升，i-EXAM 結合規劃編譯與大型語言模型，提供可視化攻擊路徑、差異化硬化建議與自然語言說明，證明在30節點測試中可減少計算時間約五成，預計將推動自動化防禦工具的商業化與開源應用。i-EXAM 透過PDDL規劃模型、Top‑k規劃器與LLM產生說明，並支援多樣化硬化選項，提升系統管理員決策效率。

深度分析

ValuePlanner：結合 LLM 與 PDDL 的價值驅動具身代理人框架

隨著具身AI逐漸突破感知瓶頸，研究提出ValuePlanner以LLM產生價值導向子目標，再由PDDL規劃器落實執行，實驗顯示其能在長期自主任務中協調衝突價值，產生更具一致性與多樣性的行為。此架構同時克服純神經模型的幻覺問題，並提供可驗證的行動計畫。

深度分析

規劃任務屏蔽：以 PDDL 列舉與 MILP 最小化修補（allmin）

研究從傳統規劃的達成目標反向出發，將「不應出現的錯誤狀態」編成規劃目標。核心作法是列舉所有可導致錯誤的計畫，並以最小修改行為集的方式阻斷這些計畫；作者提出演算法 allmin，能以最少變更使規劃任務不可解。實驗顯示此方法能有效偵測並修補規劃任務中的缺陷，強化系統安全與穩定性。

深度分析

DESPITE基準評估：以PDDL驗證LLM在機器人規劃的安全與可行性

研究指出大型語言模型被用作機器人規劃器，但其安全性未獲系統性驗證。作者提出DESPITE基準，以PDDL符號化、完全確定性檢驗一萬二千二百七十九項任務，衡量可行性與安全意圖兩項能力。結果顯示，最佳模型雖幾乎不失敗，但仍產生近三成具危害性的計畫，提示安全意識成為部署關鍵。