深度分析 GIST:以語意拓樸結合 RGB-D 與 VLM 的室內語意導航 面對零售、倉儲與圖書館等密集準靜態空間,純幾何地圖或單純視覺序列往往難以穩定提供可用的導航訊息。GIST提出一套從消費級手機點雲抽取語意拓撲的多模態流程:先投影成2D占用圖並抽取拓樸結構,接著用智能關鍵影格與視覺語言模型標注代表性物件,形成可供檢索、本地化、分區分類與自然語言路徑生成的共享語意地圖。