深度分析 MM‑BizRAG:文件結構感知驅動的企業多模態檢索增強生成框架 隨著企業文件多樣且結構複雜,傳統僅依賴頁面圖像的多模態RAG失效。MM‑BizRAG透過文件結構感知分割,對垂直報告使用版面解析、對水平投影片採用整頁表示,並在推論時分離檢索與生成表示。實驗顯示在內部企業資料與SlideVQA、FinRAGBench‑V基準上,召回率提升最高32%。