LLM Brain Rot 假說:垃圾社群文本讓大型語言模型能力下滑
一組研究提出「LLM Brain Rot 假說」,指出持續暴露於社群平台的低質文本會造成大型語言模型(LLM)持續且難以完全回復的認知衰退。研究以真實 Twitter/X 語料做對照實驗,透過兩種操作化指標(M1:互動熱度、M2:語意品質)構造「垃圾」與反向控制語料,並在相同 token 規模與訓練流程下比較效果。
研究速報:社群垃圾文會讓模型慢性退化
研究團隊提出「LLM Brain Rot 假說」,並用真實的 Twitter/X 語料設計受控實驗,檢視持續在垃圾文本上做預訓練,是否會造成大型語言模型的長期能力衰退。
實驗設計與關鍵發現
研究以兩種互不相關的操作化指標建立資料集:M1 以貼文互動度衡量,M2 以語意品質衡量,並在垃圾組與控制組間配對相同 token 規模與訓練流程。多款模型在垃圾語料持續預訓練後,推理、長文理解與安全性評估出現非輕微下滑,部分指標 Hedges' g 超過 0.3;隨著垃圾比例升高,評測呈現劑量反應,代表衰退具系統性。
錯誤法醫與修復嘗試
錯誤分析發現,推理能力的主要病灶是「跳過推理鏈」,模型較常截斷或遺漏中間推理步驟。雖然擴大指令微調和以較潔淨語料做持續訓練能部分回復能力,但無法完全恢復至原始基準,顯示代表性出現持久漂移而非僅格式不合。
意涵與建議
研究也指出,一個非語意的指標──貼文流行度,在預測 Brain Rot 效果上,比單純的長度更有預測力。整體結果提示:資料的社會屬性會影響模型能力,對持續更新與部署中的 LLM 應建立常態化的「認知健康檢查」,以監控並緩解長期能力衰退風險。
延伸閱讀
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。