視覺—語言—動作 (VLA) - Agents Report

深度分析

面對真實世界的突發挑戰，機器人需要超越單純動作執行的推理能力。RoboWits以多代理自動生成流程構築雙臂推理任務，提供種子任務、變異、場景與評分標準，並以模擬實驗衡量預訓練VLA與模組化規劃器的表現。結果顯示預訓練模型在受變異影響的場景仍然脆弱，突顯推理與策略適應的研發空白。