深度分析 PolicyBank 解構:用工具層政策庫與迭代回饋修正 LLM 代理人規格缺口 在以自然語言撰寫的授權政策常有歧義與遺漏的情境下,PolicyBank 提出一種結構化、工具層級的記憶機制,並由專門的政策代理人根據任務軌跡與開發者回饋反覆精修政策解釋。相較現有只在執行層強制或驗證的方案,PolicyBank 將「質疑並改寫」政策理解自動化,能區分執行失敗與規格錯配(alignment failure),