速報
DTBench:首個具能力感知的文件轉表格合成基準
研究團隊提出 DTBench,一套以逆向 Table2Doc 流程自動生成文件的合成基準,針對文件轉表格(Doc2Table)任務建立兩層能力分類,涵蓋 5 大類 13 小類。實驗顯示主流大型語言模型在推理、忠實度與衝突解決上仍有明顯差距,凸顯此領域的挑戰與研究空間。
速報
研究團隊提出 DTBench,一套以逆向 Table2Doc 流程自動生成文件的合成基準,針對文件轉表格(Doc2Table)任務建立兩層能力分類,涵蓋 5 大類 13 小類。實驗顯示主流大型語言模型在推理、忠實度與衝突解決上仍有明顯差距,凸顯此領域的挑戰與研究空間。
深度分析
為解決海洋鉛(Pb)資料散落於論文的資料孤島,研究提出Compass框架,將專家知識以KnowledgeTree注入LLM代理,分解為蒐集、抽取、聚合三階段並內建多重驗證。部署於230,000篇公開論文,回收3,751筆新增記錄,擴大東海與南大洋覆蓋。
深度分析
城市研究長期面臨資料分散、描述不一致與檢索困難的問題。Paper2Data 利用大型語言模型自動辨識論文內的資料集提及,並以統一的城市資料元資料模式抽取與標準化欄位,進而建構 UrbanDataMiner 這套公開的資料索引門戶。