速報人工智慧大型語言模型晶片優化 DeepSeek

DeepSeek估值飆升至45B美元：輕量化訓練與華為晶片成關鍵

DeepSeek因在2025年推出以更少運算與更低成本訓練的大型語言模型而獲關注。該模型維持開放權重並針對華為晶片進行優化，持續在推理與程式碼能力上與頂級模型競合。近期公司洽談首次募資，估值短期內顯著上升，可能助力中國發展本土人工智慧生態。

07 5月 2026 — 2 min read

要聞速報：DeepSeek估值急速上升

中國人工智慧實驗室DeepSeek正洽談首輪募資，據外媒報導，公司在數週內的潛在估值已從約200億美元上升到約450億美元。這家在2025年以輕量化訓練策略推出大型語言模型的團隊，靠低運算量與低成本訓練迅速打開知名度。

DeepSeek的模型在推理與程式碼能力上，與國際頂尖模型保持相當速度，同時維持開放權重，某些版本可在公開平台取得。創辦人梁文峰持有公司大多數股權，公司過去並未積極對外募資。

不過，面對競爭者挖角人才，梁文峰選擇募資以便發放員工股權。外媒指出，這輪據稱由國家級晶片投資基金領投，並有國內雲端巨頭洽談參與。DeepSeek同時已針對華為晶片做出運行優化；觀察者認為，這樣的晶片與模型組合，符合集體推進本土人工智慧技術、減少對外部關鍵技術依賴的國家策略。

DeepSeek尚未回應採訪請求。此次估值變動與國內資本介入，將成為中國人工智慧產業與晶片供應鏈協同發展的重要觀察指標。

原始來源：TechCrunch

系統聲明：本文的深度點評與首圖視覺，皆為 AI 代理人獨立運算生成。機器視角偶有偏差，請輔以人類智慧進行交叉驗證。

釣魚郵件是持續存在的網路安全威脅，機器學習分類器廣泛用於偵測。一項研究比較 TF-IDF 邏輯迴歸與 DistilBERT 模型，兩者在乾淨資料上準確率超過 98%，但在對抗攻擊下分別跌至 64.00% 與 63.64%。結果顯示乾淨資料準確率無法預測對抗穩健性。

CODENS 是一套將程式碼變更轉化為持續更新、可查詢文件知識庫的系統，專為 Ruby on Rails 生產環境設計。

一項新研究提出了一種名為 PSAP（Polynomial-Sensitivity-Aware Pruning）的結構化剪枝方法，旨在提升同態加密（HE）下神經網路推論的可靠性。

研究發現獨立AI代理人模擬人群時，85%的單元因傾向預設模式而崩塌。口頭抽樣（VS）技術可將忠實度提升6.8-10.1點，但會導致過度分散。調查忠實度在行為任務中僅部分轉移，且「情境無感」指標實為設計缺陷。研究建議採用分布優先策略並搭配預算感知路由器。