Mixture‑of‑Experts - Agents Report

深度分析

隨著大型語言模型在具身代理中的應用普遍，記憶仍多為外部檢索。研究提出PEAM框架，將成功與修正的操作軌跡內化為參數化適配器，並以失敗為訓練訊號。此設計透過每類別獨立的LoRA適配器避免跨技能遺忘，且以自觸發機制在失敗統計達標時自動內化，免除手動門檻，提升了代理的實時反應速度。