知識重用

深度分析

ReLoRA 以分階正則化提升 LLM LoRA 適配器相容性與效能

隨著大型語言模型持續更新，原有 LoRA 適配器會失效。ReLoRA 透過 Bayesian 優化融合舊適配器與模型演化差異，並以分階正則化快速再訓練。此作法結合適配器與模型演化的知識，提供相容性起點，並以兩階段正則化先快速收斂再精細調整。實驗顯示可將上線時間縮短近 9 倍，精度提升最高 4.6%。

深度分析

案例導向學習：提升大型語言模型自主代理人任務結構化與知識重用

研究背景：LLM 代理人在真實任務中缺乏結構化分析能力。核心技術：案例導向學習框架將過往任務轉為可重用知識資產，並以分析提示與操作技巧支援新任務。結果顯示：在六類複雜任務上持續超越零樣本、少樣本等基線，且效益隨任務難度提升而增長。