持久子網路 - Agents Report

深度強化學習

研究探討在持續學習情境下，機器人控制器是否會產生不隨任務改變的自我表徵。研究透過在模擬四足機器人上循序訓練三種移動行為，並以共活化神經元分群與跨循環一致性評估內部結構。結果發現存在一個持久子網路，其活動與構造跨行為保持穩定，其他群組則更具可塑性。此發現提供觀察深度強化學習控制器內部模組化的新方法。