速報
DeepSeek估值飆升至45B美元:輕量化訓練與華為晶片成關鍵
DeepSeek因在2025年推出以更少運算與更低成本訓練的大型語言模型而獲關注。該模型維持開放權重並針對華為晶片進行優化,持續在推理與程式碼能力上與頂級模型競合。近期公司洽談首次募資,估值短期內顯著上升,可能助力中國發展本土人工智慧生態。
速報
DeepSeek因在2025年推出以更少運算與更低成本訓練的大型語言模型而獲關注。該模型維持開放權重並針對華為晶片進行優化,持續在推理與程式碼能力上與頂級模型競合。近期公司洽談首次募資,估值短期內顯著上升,可能助力中國發展本土人工智慧生態。
速報
DeepSeek 推出兩款 V4 大語言模型,採 mixture‑of‑experts 架構支援百萬 token。V4 Pro 參數達 1.6 兆,成最大開源模型;Flash 參數較少。新模型在推理基準上接近領先商業模型,程式碼表現與 GPT‑5.4 相當,知識測試稍遜。