深度分析 Dejavu:利用經驗回饋網路提升具身智慧代理的適應性與成功率 具身代理在實際環境部署後難以自行獲取新知。Dejavu 以經驗回饋網路 (EFN) 從累積的執行記憶檢索語意相似的先前動作,並在強化學習獎勵下調整 VLA 策略。部署時持續擴增記憶庫,使代理具備「從經驗學習」能力,實驗顯著提升適應性與成功率。