深度分析 STORM 空間感知 Token 縮減提升視覺 Mamba 效能與準確率 Mamba 在視覺長序列上效能佳,但傳統 token 縮減會破壞其二維結構,導致表現大幅下滑。STORM 以空間單元為單位進行結構化縮減,保留格子拓撲與鄰域一致性,無需額外訓練。實驗顯示在 VMamba 上 Top‑1 準確度提升最高 63.3%。此成果顯示空間感知縮減可成為視覺模型部署的關鍵技術。