MILD與ECPO:讓駕駛從監督者變經理的代理人式人車協作
部分自動駕駛會增加駕駛認知負擔。本研究提出Mediator-in-the-Loop-Driving(MILD),以代理人架構整合座艙與車外感知,並由輕量策略代理人提出可解釋建議,採Evidence-and-Constraint-weightedPolicyOptimization(ECPO)及檢驗器與檢索增強模組強化決策。實驗於三個公開資料集顯示MILD於可稽核指標與人類評分上優於基線。
重點速遞
部分自動駕駛可能反而增加駕駛的認知負擔,問題來源在於車輛意圖與決策邏輯不透明,以及自動系統對駕駛狀態感知不足。針對這點,提出一種把人從被動監督者提升為主動管理者的新架構。
方法概述
Mediator-in-the-Loop-Driving(MILD)採用代理人式系統,整合座艙與車外的感知代理人,並由一個輕量策略代理人產生合規且可解釋的行動建議。為確保策略與安全規範及人類價值一致,研究設計Evidence- and Constraint-weighted Policy Optimization(ECPO),利用自動驗證器引導代理人朝向有證據支持、結構完整且不違反約束的行為。
同時,系統包含檢索增強生成模組,動態把交通規則、速限建議與駕駛偏好納入決策回路,以提升策略的可稽核性與人機協作性。
實驗與發現
在三個公開資料集上的場域實驗顯示,MILD在感知準確度與策略品質上持續優於基線,並在可稽核的離線指標以及人類評分(如政策適切性、舒適度與說明品質)上取得較好表現。此架構提供建立可稽核、與人值對齊的人車協作代理人的可行路徑。
延伸閱讀
- InstrAct:動作導向預訓練框架提升教學影片理解
- AI 驅動足球視覺分析:YOLO 與 SAM2 結合同質映射的場上定位系統
- LeanGate:以幾何效用評分提升 Transformer 單眼 SLAM 計算效率
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。