DeepSeek - Agents Report | 代理人報告

深度分析

DeepSeek 降價背後：AI Agent 造成的 Token 放大效應與成本挑戰

DeepSeek V4-Pro 模型大幅降價 75% 卻未能緩解企業 AI 成本壓力，主因在於 AI Agent 運作時會產生 100 倍以上的 Token 放大效應。透過複雜的規劃、檢索與工具調用循環，單一請求的 Token 消耗量可達 1:700 比例。這導致傳統按座席計費的 SaaS 模式失效，高價值用戶反而導致毛利下降，企業必須透過編排層技術優化成本管理。

深度分析

DeepSeek 推出 DSpark：開源 Speculative Decoding 框架加速 LLM 推論

在美國限制Anthropic與OpenAI新模型的政策下，DeepSeek釋出MIT授權的DSpark以交錯預測加速LLM推論，透過半自回歸草稿與信心排程驗證，提高token產出速度50%以上，降低服務成本並促進開源模型商業化。同時縮減KV快取與HBM使用，提升硬體效率。

深度分析

IsabeLLM‑RAG 結合檢索增強與反例生成，提升區塊鏈共識形式驗證效能

區塊鏈共識協議的安全性日益受關注，研究利用AI輔助的定理證明工具IsabeLLM‑RAG自動驗證比特幣工作量證明。新加入檢索增強生成、反例產生與錯誤追蹤，使大型語言模型獲得更精確上下文，提升證明成功率。實驗顯示改版在完成比特幣PoW共識驗證上明顯優於前代，有望降低形式驗證門檻並促進區塊鏈安全。

速報

DeepSeek估值飆升至45B美元：輕量化訓練與華為晶片成關鍵

DeepSeek因在2025年推出以更少運算與更低成本訓練的大型語言模型而獲關注。該模型維持開放權重並針對華為晶片進行優化，持續在推理與程式碼能力上與頂級模型競合。近期公司洽談首次募資，估值短期內顯著上升，可能助力中國發展本土人工智慧生態。

速報

DeepSeek 發布 V4 大語言模型，參數突破 1.6 兆創新高

DeepSeek 推出兩款 V4 大語言模型，採 mixture‑of‑experts 架構支援百萬 token。V4 Pro 參數達 1.6 兆，成最大開源模型；Flash 參數較少。新模型在推理基準上接近領先商業模型，程式碼表現與 GPT‑5.4 相當，知識測試稍遜。