深度分析 LineRides:用線條與關鍵取向引導強化學習,讓 UMV 自行車型機器人掌握高動態特技 背景:設計能表達靈活機動動作的獎勵函數相當困難。核心做法:提出以使用者繪製的空間線條與稀疏關鍵取向為介面,採行可偏差的追蹤邊界、以行駛距離決定進度、並用關鍵取向解決朝向問題。主要結果:在UMV平台上訓練出可指令且穩定的五種特技與多項實機動作。