深度分析 How² 記憶驅動代理人:以大型語言模型學習程序性知識提升規劃與終身學習 面對動作後果與資源限制的互動環境,代理人若能向教師詢問程序性「如何做」問題,便能減少不確定性並填補知識缺口。How²框架設計一個以記憶為核心的學生—教師流程:代理人先查記憶,若無相關或不再適用,則向教師提問,將回覆解析為與當前狀態脫鉤的抽象子目標並存入鍵值記憶以便重用。