端對端自駕 PaIR-Drive:平行式協同模仿與強化學習框架提升端對端自駕表現 端對端自駕依賴模仿學習受示範限制。PaIR-Drive 以平行支路同時進行模仿與強化學習,避免策略漂移。實驗顯示其在 NAVSIM 基準上達到 91.2 PDMS 與 87.9 EPDMS,表現優於傳統微調。