深度分析 「NumLeak」框架揭示基礎模型對公開數值基準的記憶泄漏機制 研究發現公開數值基準在大型語言模型預訓練中被記憶,提出NumLeak框架檢測並量化此類記憶通道,實驗顯示主流模型可在0.97相關係數下精確回復市場超額報酬,且系統提示可阻斷99.8%的記憶查詢。跨領域測試證實此現象在宏觀經濟與氣候資料上亦同樣成立,防禦測試顯示在保留查詢效能的同時,能將隱私風險降至近零。