速報 DRFLOW 基準揭示深度研究系統工作流程預測挑戰 深度研究(DR)系統已從產出報告與摘要,逐步擴展到協助使用者完成具體工作流程的需求。為評估此類能力,研究團隊推出 DRFLOW 基準,收錄 100 筆跨五大領域、超過 3,900 來源的任務,提供 1,246 步驟作為參考。基準設計七項診斷指標,涵蓋事實根據、步驟復原、結構排序、條件解析與個人化等面向。