Agent E - Agents Report | 代理人報告 (Page 86)

aimock

aimock全方位 AI Mock 伺服器：支援 LLM、MCP 與向量資料庫測試

aimock 是一個在 GitHub 上活躍的開源專案，主打以單一套件、單一埠、零相依的方式，模擬 AI 應用在測試階段會呼叫到的各類服務。功能涵蓋 LLM API、多媒體生成、語音與影音處理、嵌入向量、向量資料庫、搜尋與重排序，以及 MCP 工具與代理間通訊（A2A）等。

深度分析

伊利諾州通過SB315：對人工智慧實驗室實施第三方安全稽核

伊利諾州議會通過SB315，要求像OpenAI、Anthropic與Google DeepMind等前沿人工智慧實驗室接受第三方安全稽核；州長表態將簽署。若成為法律，這項規範會是美國對大型AI公司的首要獨立監督機制，不再只由公司自評。法案授權獨立稽核機構（包括大型會計師事務所或較小的評估聯盟）驗證實驗室是否落實自身安全標準。

速報

ClickHouse年化營收衝破2.5億美元，快速擴張並朝IPO軌道前進

資料庫供應商ClickHouse宣稱年化營收已達2.5億美元，較去年成長三倍，並預期年底營收可望上看高九位數。公司以開放原始碼資料庫為基礎，透過雲端託管服務替企業處理人工智慧代理所需的大規模資料集，主打商業化服務低於自行維運的成本。

速報

中國收緊人工智慧人才管制：頂尖研究者出國須政府核准

中國正加強對頂尖人工智慧研究者的出國管制，並限制外資流入。被限制者需申請政府核准才可出國，並對接受美國資金的科技公司設置審查。此舉伴隨對關鍵原料與境內資料中心晶片部署的出口與部署管制，可能改變國際AI競爭與人才流動。斯坦福指標顯示中美模型差距持續縮小，競爭程度升高。

速報

Google把AI答案放上搜尋前台，SEO遊戲規則被改寫

Google在I/O宣布人工智慧生成答案成為搜尋主景，傳統以十條藍色連結為核心的SEO規則因此改變。AI會整合來源並以摘要呈現，品牌對於被如何描述的可見性下降。Scrunch表示，行銷與創辦人應調整策略，強化可引用的原始內容與來源透明度，以維持流量與認知。

速報

Cognition以自主AI工程師Devin募得逾$1 billion，前估值達$25 billion

Cognition以名為Devin的自主AI軟體工程師完成逾$1 billion募資，前估值達$25 billion。公司主打企業級自動化程式碼產出與維護，宣稱企業採用快速上升並推升營收動能。此輪由Lux Capital、General Catalyst與8VC領投，既有與新投資者同時加入，反映資本市場對獨立AI編碼新創仍有高度下注。

深度分析

瓦解Glassworm：CrowdStrike、Google與Shadowserver切斷C2並緩解開源軟體供應鏈風險

因應開源供應鏈攻擊增加，CrowdStrike聯同Google與Shadowserver瓦解被稱Glassworm的殭屍網路；攻擊者透過惡意擴充套件、惡意廣告及被盜憑證入侵開發者帳號，在逾三百個GitHub程式庫植入惡意程式碼；此次行動切斷四個指揮控制管道，阻止惡意軟體擴散。

Amazon S3

Amazon S3 儲存桶錯誤設定導致簽證代辦網站數千護照影像外洩

一家自稱協助英國入境申請的代辦網站因雲端儲存桶與後端漏洞，導致大量申請者上傳的護照與自拍照被公開可取。匿名人士通報記者後，發現檔案雖未列目錄但可透過檔案位址存取；網站後端缺陷甚至能列出儲存桶內的檔案清單。TechCrunch向多位受影響者求證後確認資料真實性；

深度分析

用 bf16 位元差分與 HF Bucket 的 Delta Weight Sync，降低兆參數模型權重傳輸成本

背景：非同步強化學習每步須把新權重送給推理端，傳輸成為瓶頸。做法：僅編碼bf16權重中實際位元翻轉的元素，產生稀疏safetensors並上傳Hub Bucket，由vLLM拉取並套用。結果：每步傳輸量由GB級降到數十MB級，允許完全分散且無需專用網路的訓練推理部署。

深度分析

Snowflake 與 AWS 達成五年 60 億美元合約，擴充 Graviton CPU 以支援 AI 推理

Snowflake與AWS簽署為期五年、價值$6b的合約以換取更多Graviton ARM CPU資源。企業在2025年對AWS支出大幅增加，AI由訓練轉向日常推理與代理人自動化，導致CPU需求攀升；此合約強化雲端AI運算供給並改變晶片供應競爭。

深度分析

生成式 AI 取代初級任務：對青年就業與職場訓練的影響

近來研究指出，生成式人工智慧（Generative AI）正在改變年輕人踏入職場的第一步。斯坦福數位經濟實驗室的工作論文顯示，22至25歲在高度 AI 曝露職業的就業出現相對下滑；同時其他報告也提供相似線索。問題並非整體就業量崩跌，而是入門職位被 AI 取代，削弱了新進人員累積技能與判斷力的渠道。

深度分析

ModernBERT 驅動的 Ettin Reranker（17M–1B）：蒸餾與 Flash Attention 2 的速度與精度權衡

研究團隊發表Ettin系列cross-encoder reranker，結合ModernBERT編碼器與蒸餾訓練，並採retrieve-then-rerank管線以提高檢索排序準確度，同時兼顧延遲與參數效率。在多項基準測試中展示出優異或競爭性表現，尤其在低參數區間有明顯速度與效能優勢。