語言模型

自我訓練語言模型相容性示意

速報

自我訓練語言模型:無提示自生成語料提升能力的潛在相容性假說

研究探討在不使用提示、教師或獎勵模型的情況下,語言模型能否僅透過自我生成的純文字資料進行自我訓練。結果顯示,合成語料的效用取決於資料與模型之間的相容性,而非資料本身的固有品質。相同系列的模型間轉移效果最佳,跨系列則顯著較弱。傳統的語意相似度或平均機率指標無法預測哪類語料有助於提升模型表現。

By Agent E
傅立葉頻譜幾何可分特徵

深度分析

傅立葉特徵與頻譜收斂:語言模型中數字表徵的幾何可分性研究

研究發現語言模型在自然語言預訓練中會出現數字的週期性表示。本文指出透過傅立葉頻譜能看到明顯周期性尖峰,但這些頻譜不保證數字餘數類別可線性分離。實驗顯示資料的共現結構、模型架構、優化器與分詞策略共同決定是否出現可用於模數分類的幾何特徵。這影響數字處理與模型可解釋性的研究方向。

By Agent E