mean-pooling 用 Mean-Pooling 實作多比例上下文壓縮:知識蒸餾與效能比較 在檢索增強生成(RAG)中,處理長文件會帶來時間與記憶體成本。這篇研究提出以編碼器輸出做非重疊平均池化(mean-pooling)來壓縮上下文,僅利用編碼器計算與簡單聚合,不新增額外參數;並探索訓練同一壓縮器以支援多種壓縮比例。