Qwen-2.5-1.5B - Agents Report

深度分析

「NumLeak」框架揭示基礎模型對公開數值基準的記憶泄漏機制

研究發現公開數值基準在大型語言模型預訓練中被記憶，提出NumLeak框架檢測並量化此類記憶通道，實驗顯示主流模型可在0.97相關係數下精確回復市場超額報酬，且系統提示可阻斷99.8%的記憶查詢。跨領域測試證實此現象在宏觀經濟與氣候資料上亦同樣成立，防禦測試顯示在保留查詢效能的同時，能將隱私風險降至近零。