場景圖 - Agents Report | 代理人報告

深度分析

家庭實境中智能代理面臨完整場景與口語需求的推理挑戰。本文提出TaskGround，採Ground–Infer–Execute流程先切出任務相關場景片段，再推理可執行任務結構並編譯為技能層級動作序列。實驗在FullHome評測集上展示顯著提升，使緊湊開源模型在成本下競爭性提高。