深度分析 生產級 PDF 解析管線:結合啟發式表格偵測與 Sentence-BERT/CLIP 語義配對 PDF含表格、圖表與表單,準確抽取關鍵視覺元素對文件理解與多模態檢索至關重要。本研究提出輕量級生產等級解析框架,結合空間啟發式、版面分析與語義相似度進行元素偵測與標題配對。系統能過濾水印與商標、合併碎片影像,並在多項基準與內部資料上提升檢索與問答效能。實驗顯示解析精度與關聯率顯著提升,且延遲大幅降低。