拉馬克式遺傳在機體與控制共優化中的條件性優勢
團隊研究機體與控制器共同優化的耦合問題。將形態優化視為演化,控制器視為終身學習,並以拉馬克式遺傳移轉學得參數。在虛擬軟體機器人上以貝氏優化與強化學習驗證,發現拉馬克式僅在環境改變同時具衝突且不可預測時劣於達爾文式;加入環境感測能恢復其優勢,幫助控制泛化。
速報:拉馬克式遺傳在動態環境下的條件性優勢
研究指出,在機體與控制器共同優化的問題中,是否採用拉馬克式遺傳取決於環境改變的衝突性與可預測性。
研究團隊把形態優化視為演化、把控制器視為個體終身學習,將學得的控制參數從父代移轉到子代。透過虛擬軟體機器人,並結合貝氏優化與強化學習,比對拉馬克式與達爾文式兩種遺傳策略在動態環境下的表現。
實驗結果顯示,拉馬克式只有在環境改變既互相衝突又不可預測時,才會落後於純演化;若代理人能透過感測器偵測環境變化並據此調整行為,拉馬克式可恢復優勢,幫助控制更好地泛化。
此研究提醒設計機器人時,應評估環境變化的性質與可預測性,並考慮感測與學習策略的整合以提升整體效能。
延伸閱讀
- AADvark:以 FreeCAD、JSON 與四元數求解器實現可動組裝的代理式 CAD
- SciCrafter 基準:用紅石電路評測大型語言模型在實驗發現與工程應用的瓶頸
- 主動推理與 empowerment:以量化指標界定 AI 的代理性
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。