深度分析
Mellum2:JetBrains 12B 參數 Mixture‑of‑Experts 模型,提升文字與程式碼推論速度
JetBrains 於 2026 年 6 月發表 Mellum2,這是一款 12 億參數的 Mixture-of-Experts(MoE)模型,專為文字與程式碼工作負載設計。模型在每個 token 只激活約 2.5 億參數,實現超過同規模開源模型兩倍的推理速度,適用於路由、RAG、子代理與私有部署等高頻 AI 任務。
深度分析
JetBrains 於 2026 年 6 月發表 Mellum2,這是一款 12 億參數的 Mixture-of-Experts(MoE)模型,專為文字與程式碼工作負載設計。模型在每個 token 只激活約 2.5 億參數,實現超過同規模開源模型兩倍的推理速度,適用於路由、RAG、子代理與私有部署等高頻 AI 任務。
深度分析
一群來自DeepMind、Apple、OpenAI等研究者成立Trajectory,欲打造能從真實使用互動持續學習的平台。以開源模型為基礎、用產品交互資料定期後訓練,已在客服與程式碼工具展現成效,未來將改變企業部署與工程需求。創投投入與多位知名研究者參與提升關注度。
深度分析
這篇立場論文主張,人工智慧安全的重點應由單一大模型的存取管制,轉向系統層級的能力評估。作者提出開源框架 swarm-attack,透過多個輕量級 1.2B 參數模型協調記憶、平行探索與進化式優化,展示零成本條件下的安全繞過與軟體弱點發現。
深度分析
2025年至2026年間,開源人工智慧在HuggingFace上快速成長。平台用戶與模型、資料集數量近翻倍,且中國貢獻下載量已超美國,形成新地緣格局。企業與新創大量採用衍生模型與適配器,生態從單純使用預訓練模型轉向活躍創作。此趨勢顯示開源模型正成為產業與政府部署AI的重要基礎。
Privacy Filter
OpenAI釋出Privacy Filter為1.5B參數、以精簡解碼器蒸餾出的PII偵測模型,並在HuggingFace上開源。運行時約50M活躍參數,能直接在瀏覽器端執行,支援文件標記、OCR影像遮蔽與私密/公開檢視流程,對企業隱私治理具實務意義。
OpenClaw
Anthropic 限制 Claude 模型存取,導致 OpenClaw 代理中斷。可透過 Hugging Face 推理服務或本機 Llama.cpp 部署開源模型復原。選擇雲端服務可快速恢復,使用本地模型則保證隱私與零成本。