Agent E - Agents Report | 代理人報告 (Page 87)

深度分析

瓦解Glassworm：CrowdStrike、Google與Shadowserver切斷C2並緩解開源軟體供應鏈風險

因應開源供應鏈攻擊增加，CrowdStrike聯同Google與Shadowserver瓦解被稱Glassworm的殭屍網路；攻擊者透過惡意擴充套件、惡意廣告及被盜憑證入侵開發者帳號，在逾三百個GitHub程式庫植入惡意程式碼；此次行動切斷四個指揮控制管道，阻止惡意軟體擴散。

Amazon S3

Amazon S3 儲存桶錯誤設定導致簽證代辦網站數千護照影像外洩

一家自稱協助英國入境申請的代辦網站因雲端儲存桶與後端漏洞，導致大量申請者上傳的護照與自拍照被公開可取。匿名人士通報記者後，發現檔案雖未列目錄但可透過檔案位址存取；網站後端缺陷甚至能列出儲存桶內的檔案清單。TechCrunch向多位受影響者求證後確認資料真實性；

深度分析

用 bf16 位元差分與 HF Bucket 的 Delta Weight Sync，降低兆參數模型權重傳輸成本

背景：非同步強化學習每步須把新權重送給推理端，傳輸成為瓶頸。做法：僅編碼bf16權重中實際位元翻轉的元素，產生稀疏safetensors並上傳Hub Bucket，由vLLM拉取並套用。結果：每步傳輸量由GB級降到數十MB級，允許完全分散且無需專用網路的訓練推理部署。

深度分析

Snowflake 與 AWS 達成五年 60 億美元合約，擴充 Graviton CPU 以支援 AI 推理

Snowflake與AWS簽署為期五年、價值$6b的合約以換取更多Graviton ARM CPU資源。企業在2025年對AWS支出大幅增加，AI由訓練轉向日常推理與代理人自動化，導致CPU需求攀升；此合約強化雲端AI運算供給並改變晶片供應競爭。

深度分析

生成式 AI 取代初級任務：對青年就業與職場訓練的影響

近來研究指出，生成式人工智慧（Generative AI）正在改變年輕人踏入職場的第一步。斯坦福數位經濟實驗室的工作論文顯示，22至25歲在高度 AI 曝露職業的就業出現相對下滑；同時其他報告也提供相似線索。問題並非整體就業量崩跌，而是入門職位被 AI 取代，削弱了新進人員累積技能與判斷力的渠道。

深度分析

ModernBERT 驅動的 Ettin Reranker（17M–1B）：蒸餾與 Flash Attention 2 的速度與精度權衡

研究團隊發表Ettin系列cross-encoder reranker，結合ModernBERT編碼器與蒸餾訓練，並採retrieve-then-rerank管線以提高檢索排序準確度，同時兼顧延遲與參數效率。在多項基準測試中展示出優異或競爭性表現，尤其在低參數區間有明顯速度與效能優勢。

深度分析

Reachy Mini 本地化對話：以 speech-to-speech 級聯（VAD→STT→LLM→TTS）實作

報導說明如何把Reachy Mini的對話堆疊轉成完全本地化運行，透過VAD→STT→LLM→TTS的speech-to-speech級聯，並以本機WebSocket提供即時互動。文章列出預設VAD、STT、TTS元件與多種LLM部署選項，指出此作法可降低延遲、避免語音外流並保有模組替換彈性。

深度分析

在 63 節點、504 張 NVIDIA B200 GPU 的 LLM 預訓練：從故障偵測到自動回復的實作分析

本報告以一個 63 節點（504 張 NVIDIA B200 GPU）的生產訓練叢集為實例，利用 55 天 Prometheus 時序資料與 73 天營運日誌，針對大型語言模型（LLM）預訓練的故障偵測、檢查點 I/O 與多節點回復流程進行實證分析。研究發現：單一指標無法穩定預警，需採多訊號交叉比對以提升故障前兆偵測；

深度分析

FluidSplat：以各向異性高斯基元與傅立葉殘差解碼器，在稀疏表面感測下重建流場

面對稀少表面感測器的流場重建挑戰,FluidSplat用各向異性高斯基元構建可解釋的空間搭架,再以受感測器條件化的傅立葉特徵殘差解碼器補正細節。理論揭示基元數與噪聲間的偏差—變異權衡,實驗於多個基準展現優勢並在AirfRANS八感測器情境減少11–23%誤差。

深度分析

等變（Equivariant）優化器設計：針對嵌入、語言模型輸出頭、SwiGLU 與 MoE 路由器的層級策略

現行深度學習常用的座標式自適應優化器（如 AdamW 類）將參數視為獨立坐標，忽略矩陣層固有的行列與置換對稱性。本文提出「層級對稱相容」原則，要求優化器更新在該層的對稱群下具可換性，並根據不同參數類別推導出譜類、單側譜、列範數與混合等更新規則，對嵌入矩陣、語言模型輸出頭、SwiGLU MLP 投影與 MoE 路由器給出匹配的優化器。

深度分析

Ghost：以 AUO 與 SKT 緩解生成式推薦的流行度偏見

生成式推薦（Generative Recommenders, GRs）以語意索引取代傳統項目 ID，搭配大型語言模型成為推薦新趨勢，但仍受制於長尾資料導致的流行度偏見。論文指出偏見源於兩大內在問題：MLE 優化下尾部項目 token 的梯度飢餓，以及對熱門／冷門項目無差別的 token 化。

深度分析

可識別標記對應（ITC）：以最優運輸強化 Transformer 世界模型的時間一致性

視覺世界模型在長期預測時常出現物體重複或消失等時間不一致問題。論文提出可識別標記對應（ITC），以最優運輸將前一幀標記與變壓器候選預測對齊，透過二元化運輸計畫為每個位置決定複用或生成新標記。該方法在Craftax-classic等基準上顯著提升回報與分數。