深度分析 IRTS-ToolBench:首套工具化不規則時間序列問答基準,驗證 LLM 與 AI 代理推理能力 現實系統的時間序列普遍不規則,IRTS-ToolBench以語意導向的正則轉不規則管線與30種工具庫,收錄1,700題跨13領域10種任務,填補了現有基準只支援規則序列的缺口。測試顯示,啟用工具呼叫可將模型在異常偵測等關鍵任務的正確率提升逾5%,並顯示AI代理在處理不規則時間序列時的潛在優勢。