具身智慧代理 - Agents Report

深度分析

具身代理在實際環境部署後難以自行獲取新知。Dejavu 以經驗回饋網路 (EFN) 從累積的執行記憶檢索語意相似的先前動作，並在強化學習獎勵下調整 VLA 策略。部署時持續擴增記憶庫，使代理具備「從經驗學習」能力，實驗顯著提升適應性與成功率。