深度分析 當全域紋理主導:視覺RAG 單向聚合在財務文件檢索的局限與診斷 研究檢視視覺RAG在表格為主的財務文件上,將視覺patch壓縮成單向量是否遺失關鍵數值。作者用兩個財務測試集和多種聚合策略,結果顯示平均或最大池化無法辨別細微數字或文本變動,主因在於背景版面或格線的全域紋理主導,建議採多向量或學習型聚合以降低檢索風險。