經驗蒸餾

深度分析

Steve‑Evolving 提出一套非參數的自我演進架構，專為開放世界的具身代理人設計。方法把每次子目標執行固化為結構化經驗（前狀態、動作、診斷結果、後狀態），透過細緻執行診斷提供高資訊密度，並採雙軌蒸餾把成功軌道泛化為可重用技能、失敗軌道抽取為可執行防護規則。

深度分析

大型語言模型驅動的代理人若僅靠靜態工具或自行生成資產，演化受限。Mem⁲Evolve 透過共演的能力擴展與經驗蒸餾，同時利用經驗記憶指導資產創建，提升代理人能力空間。實驗顯示其在多任務基準上較傳統方法有顯著提升，並提升演化穩定性。