大佬動態
Cerebras 上市震撼資本市場:推論晶片成為資本新寵
Latent.Space 在 AINews 快報以「Cerebras’ $60B IPO」為題,對這家以推論晶片聞名的公司本次公開募股作出即時觀察。文章回顧公司在募資路徑上的波折、與大型雲端/AI 玩家間的合作談判,以及市場對推論運算需求的期待。
大佬動態
Latent.Space 在 AINews 快報以「Cerebras’ $60B IPO」為題,對這家以推論晶片聞名的公司本次公開募股作出即時觀察。文章回顧公司在募資路徑上的波折、與大型雲端/AI 玩家間的合作談判,以及市場對推論運算需求的期待。
大佬動態
背景:Mozilla以ClaudeMythos預覽進行安全檢測。方法是用生成式人工智慧產出漏洞報告,並由工程師驗證與修補。結果找出並修正數百處Firefox漏洞,顯示模型在安全審查上變得更有用。過去此類報告常有錯誤,現今模型能力提升,使問題回報從噪音轉向具參考價值。
大佬動態
社群訊號報導Anthropic與SpaceX/xAI達成協議使用Colossus資料中心全部運算容量。案件核心在於大型集中式資料中心負載與能源調度,牽涉訓練與推論的運算集中化與資源配置。主要影響是對AI研發生態與永續治理提出新的監督與透明要求。
大佬動態
IBM推出Granite4.1系列,含3B/8B/30B並採Apache2.0授權。社群發佈3B的21種GGUF量化變體供比較。以「Generate an SVG of a pelican riding a bicycle」為提示測試不同量化檔,發現輸出差異有限,意味量化變體可維持某些生成能力並促進本地實驗。
大佬動態
最近社群出現一個技術訊號:Salvatore Sanfilippo 在分支中提交了將「arrays」當作新資料型別納入 Redis 的 PR,並新增一組對應命令。
大佬動態
社群動態披露新專案talkie,以「vintagemodel」概念訓練,訓練資料限定於1931年前英文文本。主要做法是以年代切分語料訓練模型,觀察歷史語言風格與模型行為。此示範凸顯時間切割語料對語言模型研究與文化保存的參考價值。對研究者與保存者都有啟發性。
大佬動態
OpenAI宣布對Microsoft之收入分成延續至2030且不以技術進展為條件。此變動暗示與AGI相關的觸發條款已被移除或修正,合約轉以期限與總額上限為主。結果:降低以AGI為界的商業不確定性,可能影響其他雲端與模型供應商之商業談判與生態布局。
大佬動態
DeepSeek發布V4系列包含V4Pro(1.6T)與V4Flash(284B)並提供Base與Instruct版本,同時宣稱可在華為Ascend晶片上運行。此舉顯示模型針對非傳統GPU的相容優化與平台多元化,發布後於公開基準上不再位居榜首,但仍可能改變開發者與部署的硬體選擇與策略。
大佬動態
SimonWillison發布llm0.31,為命令列存取大型語言模型的工具帶來更新。新版本註冊了GPT-5.5並新增可設定回覆冗長度的參數(low、medium、high),同時引入影像細節選項(low、high、auto,GPT‑5.4與5.5可用original)。這些調整提高CLI對回應與圖像輸出的可控性,便於自動化腳本整合。
大佬動態
SimonWillison發布訊號指出DeepSeek推出V4預覽版,兩款均為MixtureofExperts並支援100萬token上下文;Pro採1.6T總參數且49B啟動,Flash為284B總參數與13B啟動,並以MIT授權釋出;此一發布將擴展開放權重與長上下文實驗的可及性,可能影響研究與部署習慣。
大佬動態
Bluesky 用戶 Simon Willison 發文指出 DeepSeek V4 已釋出,這次同時推出 Flash 與 Pro 兩個型號。Willison 提到兩款在基準測試表現良好,並以價格優勢落在各自類別的低價帶。對台灣科技與開發者生態而言,這代表市場又多出更便宜的高效能選項,可能降低應用門檻並促使更多團隊嘗試不同模型。
大佬動態
Simon Willison 指出 GPT‑5.5 已透過 OpenAI Codex 可用並向付費 ChatGPT 推播;他預覽後稱模型反應快速且能依指令構建結果,但 API 尚未全面開放,OpenAI 正與夥伴協作處理部署與安全,短期內會將 GPT‑5.5 帶上 API,這將影響基準測試與開發者可重現性。