速報 FoLoRA 忘記感知微調基礎模型保留 LoRA 優化

FoLoRA：保留基礎模型能力的忘記感知 LoRA 優化框架

微調雖能讓基礎模型適應特定任務，但常會削弱預訓練時獲得的通用能力。為了同時提升目標任務表現與保留非目標能力，研究團隊提出 Foundation Preserving LoRA（FoLoRA），一種以遺忘懲罰與任務效用為指標的優化方法。

02 6月 2026 — 2 min read

微調是讓大型基礎模型適應特定下游任務的常見做法，但在提升目標表現的同時，往往會犧牲在預訓練階段累積的通用能力。

FoLoRA：忘記感知的保留優化框架

研究者提出 Foundation Preserving LoRA（FoLoRA），作為一套考量遺忘與效用的優化機制。它以第一階保留條件為基礎，將遺忘懲罰定義在「預訓練代理」的激活上，同時以下游任務的激活衡量任務效用。

在每一次參數更新時，FoLoRA 會計算「每單位遺忘懲罰的任務效用」——即透過廣義 Rayleigh 商得到的分數，並以此分數對更新方向進行排序。這樣產生的光譜座標系統，使得 Adam 更新可以對效用低於遺忘懲罰的方向施加門控衰減，避免過度破壞非目標能力。

為了估算遺忘懲罰，FoLoRA 並不依賴單一的代理資料集，而是從已預訓練模型中抽樣，構建多樣化的校準資料，讓遺忘指標更貼近真實的通用能力分佈。

在數學推理、程式碼生成與指令遵循三大微調任務上，FoLoRA 均展現出比現有方法更佳的保留與適應平衡。相較於傳統 LoRA 或其他遺忘感知技術，FoLoRA 能在提升目標任務準確度的同時，最大化非目標能力的總體保留。

此結果顯示，透過遺忘懲罰與效用的協同考量，模型微調可以更安全、更有效地延伸基礎模型的應用範圍。

原始來源：ArXiv AI

系統聲明：本文的深度點評與首圖視覺，皆為 AI 代理人獨立運算生成。機器視角偶有偏差，請輔以人類智慧進行交叉驗證。

AI 科學文獻合成代理系統的引用驗證機制存在重大不一致性。研究發現同一輸出在不同驗證器下無支援引用率從約 3% 到 18% 不等，且驗證器間對須標記案例共識極低。團隊提出以人類黃金標準為錨點的評估協議與基於分割共形預測的防護機制，能對未標記的無支援引用提供有限樣本保證。

OpenAI 的 GPT-5.5 Pro 模型自主生成七個反例，證明了實數域上的 Erdős–Szemerédi 和積猜想不成立。該研究使用三階段提示流程，在八次試驗中七次成功，平均耗費 132.4k 推理 token。證明方法多樣，部分避開單位構造，採用 Lp 型區域，減少數論需求。

本研究提出 CMI-Mem，一種以強化學習為基礎的輕量級記憶管理器模型。傳統的記憶管理器依賴大型語言模型（LLM）作為評審，透過合成問答（QA）對來評估記憶品質，但這種方法會使記憶的價值受到抽樣查詢與下游閱讀器的影響，導致泛化能力受限。

後端程式碼生成常因缺乏執行驗證而產生語義錯誤。ExecuGraph 提出基於 LangGraph 的多代理人架構，以執行結果為唯一驗收標準。在 HumanEval 上領先單次生成 3.1 個百分點，但內部 30 題庫的統計差異未達顯著，顯示效益與模型規模相關。