速報 Camelot 與 LLM 混合策略:在學術表格式 PDF 的高效資訊擷取 從學術 PDF 擷取結構化資料不易,單頁常混合自由文字與表格,還會受 Unicode 編碼影響。本研究以印尼高教的選課表(KRS)為案例,比較三種策略:純 LLM、正規表達式+LLM 的混合決定性流程,以及以 Camelot 為主、LLM 備援的管線。