深度分析 ST-Prune:訓練免依賴的時空令牌剪裁,提升自駕視覺語言模型效能 自駕系統面對多鏡頭多影格的視覺爆炸,ST-Prune提出兩階段無訓練令牌剪裁:以運動波動與時序近因優先保留動態資訊,再利用環形視角抑制跨鏡頭重複背景。實驗於多項基準在高壓縮下仍維持近無損表現,兼顧速度與資源效率。未來仍需在閉環決策場景做進一步驗證。