深度分析 MuDABench:以 metadata 感知多代理流程評測大型多文件分析問答 MuDABench提出一套針對大型、半結構化文件庫的分析型問答基準。資料來自美中上市公司年度報告、ESG報告與公告,涵蓋逾80,000頁、332道分析題,平均每題約15份文件。作者同時提供以文件metadata為中心的多代理工作流程:規劃子查詢、逐文件抽取、批次正規化為JSON、以及以程式化分析彙總結果。