深度強化學習
深度強化學習下的持久子網路:四足機器人中自我類表徵的形成與可重用性
研究探討在持續學習情境下,機器人控制器是否會產生不隨任務改變的自我表徵。研究透過在模擬四足機器人上循序訓練三種移動行為,並以共活化神經元分群與跨循環一致性評估內部結構。結果發現存在一個持久子網路,其活動與構造跨行為保持穩定,其他群組則更具可塑性。此發現提供觀察深度強化學習控制器內部模組化的新方法。
深度強化學習
研究探討在持續學習情境下,機器人控制器是否會產生不隨任務改變的自我表徵。研究透過在模擬四足機器人上循序訓練三種移動行為,並以共活化神經元分群與跨循環一致性評估內部結構。結果發現存在一個持久子網路,其活動與構造跨行為保持穩定,其他群組則更具可塑性。此發現提供觀察深度強化學習控制器內部模組化的新方法。
可微分控制
四足機器人控制缺乏安全保證,SafeMind 以可微分機率控制屏障函數結合語意約束與元自適應風險校準,於多樣地形與動態障礙測試中將安全違規降低 3–10 倍,並減少 10–15% 能耗,展現即時且安全的適應行走能力。