模型蒸餾 - Agents Report

Infographic: Nadella warns of enterprise AI data risks, favoring owned data and open-source models.

深度分析

微軟執行長 Nadella 警示：AI 模型資料所有權與自建學習環境的重要性

AI企業使用大型模型時，會把自家機密資訊餵給模型提供者，可能成為未來競爭者。微軟執行長納德拉警告，企業付出金錢與資料雙重代價，建議保留資料所有權並採用開源或自建模型。此趨勢或改變AI生態。模型會從企業的指令與修正中學習，形成不可買的知識。納德拉主張企業在雲端建置學習環境使用模型切換層避免鎖定供應商。

深度分析

從 CTP 到 CTBE：共享初始化與表徵對齊在模型蒸餾與 LLM 微調中的影響

研究指出，當教師與學生模型共享初始權重且學習率足夠小時，即使學生只接受純噪音訓練，也能繼承教師的數字分類能力。此現象被稱為隱蔽特徵傳遞，核心機制是表徵對齊而非資訊傳遞。實驗顯示，凍結輸入投影會破壞傳遞，而凍結輸出投影則不影響，證實幾何對齊是關鍵。

深度分析

Shopify 建置跨供應商 LLM 代理與蒸餾平台，實現自動故障轉移與代幣管理

Shopify為內部開發者建置LLM代理平台，可自動切換多家AI供應商並在服務中斷時自動故障轉移。平台支援模型蒸餾，使小型模型在成本與速度上比大型模型快2至30倍。當ClaudeFable5停止時，系統即切換至ClaudeOpus或GPT5.5，開發者可於Tangle即時觀察蒸餾與代幣使用情形。

速報

對抗模型蒸餾：Product-of-Experts (PoE) 的防禦與自適應評估

研究指出模型輸出在提升實用性與被模仿間存有權衡。作者提出一個師生最小極大對弈，並導出自適應評估與抑制重要輸出的教師端防禦。從代理價值估計衍生Product-of-Experts(PoE)前向防禦。實驗顯示在自適應評估下，被動防禦過度樂觀，強化蒸餾仍難阻擋。

Anthropic Mythos

Anthropic Mythos 採取選擇性釋出：以網路安全為名，防止模型蒸餾技術複製

Anthropic 的新模型 Mythos 因「太強」而未對外公開，僅提供給特定大企業。官方稱是為了網路安全，但業界質疑這其實是為了防止模型蒸餾與強化企業合約。這場關於安全與商業利益的博弈，揭露了頂尖 AI 實驗室的生存戰術。