深度分析
NavOne:以 Top‑Down VLN 在俯視地圖上一次性進行全域路徑規劃
在視覺語言導航領域,傳統採用自我中心逐步決策,易累積誤差且成本高昂。論文提出NavOne,將導航重新定義為在先建的俯視地圖上一次性全局規劃,直接輸出密集路徑與目標機率圖,並以R2R-TopDown資料集驗證。結果顯示在地圖基礎方法中達到領先表現,同時大幅提速。
深度分析
在視覺語言導航領域,傳統採用自我中心逐步決策,易累積誤差且成本高昂。論文提出NavOne,將導航重新定義為在先建的俯視地圖上一次性全局規劃,直接輸出密集路徑與目標機率圖,並以R2R-TopDown資料集驗證。結果顯示在地圖基礎方法中達到領先表現,同時大幅提速。
HTNav
城市空拍視覺語言導航因物流與檢測需求受關注。HTNav 以混合模仿與強化學習、層級決策與地圖表示提升泛化與長程規劃。實驗在 CityNav 基準上創下全項最佳成績,顯示其在複雜城市環境的導航精度與穩定性顯著提升。