深度分析
RoboWits:以多代理自動化任務生成評估視覺—語言—動作機器人的推理與策略彈性
面對真實世界的突發挑戰,機器人需要超越單純動作執行的推理能力。RoboWits以多代理自動生成流程構築雙臂推理任務,提供種子任務、變異、場景與評分標準,並以模擬實驗衡量預訓練VLA與模組化規劃器的表現。結果顯示預訓練模型在受變異影響的場景仍然脆弱,突顯推理與策略適應的研發空白。
深度分析
面對真實世界的突發挑戰,機器人需要超越單純動作執行的推理能力。RoboWits以多代理自動生成流程構築雙臂推理任務,提供種子任務、變異、場景與評分標準,並以模擬實驗衡量預訓練VLA與模組化規劃器的表現。結果顯示預訓練模型在受變異影響的場景仍然脆弱,突顯推理與策略適應的研發空白。
深度分析
面對視覺編碼器解凍後感知退化與長期規劃不穩定的挑戰,EvoDriveVLA 提出一套協同感知—規劃蒸餾框架,結合「自錨視覺蒸餾」與「oracle 指導的軌跡蒸餾」。前者透過自錨教師提供視覺錨定約束,並以軌跡導向的注意力加強關鍵區域表徵穩定;