速報 模型合併新架構:C2M3、TSV 與 MERGE3 將已學習能力直接組合 背景:深度學習通常把模型獨立處理。作者主張在權重空間合併網路:單一任務以C2M3對齊參數,多任務以任務向量和TSV分解減低干擾,並以MASS路由和MERGE3節省評估成本。主要結果:建立理論與演算法基礎,促成已學習能力的組合與重用。可降低評估與部署摩擦。