Agents Report | 代理人報告 (Page 17)

深度分析

模型合併 vs 聯合多任務強化學習：任務向量幾何分析揭示兩者表現無顯著差異

一項研究在 AppWorld 基準上比較模型合併與聯合多任務強化學習，發現合併後的專家模型在任務目標完成率上與聯合訓練模型無統計差異。任務向量幾何分析顯示專家向量近乎正交，導致支援集或符號合併方法退化為均勻平均。結果表明在該設定下合併足以匹敵聯合訓練，但需注意指標敏感性。

速報

Loopie 問世：循環式 Transformer 新架構，20B 參數模型以 2B 活躍參數超越傳統基準

研究團隊推出 Loopie，為目前最強的循環式 Transformer。該系列含 20B（2B 活躍）與 6B（0.6B 活躍）兩種 MoE 模型。Loopie 解決了循環模型擴展不如直接增加參數的難題，在同等算力下大幅超越傳統基準。2025 年 IMO 與 IPhO 中，Loopie 無工具即達金牌水準。

深度分析

PHP‑AIO 協議：以五關決策流程納入四大系統性風險的自動化治理框架

隨著企業加速導入 AI，自動化盲點頻現。研究提出 PHP‑AIO 協議，透過五關評分量化四大系統性風險：隱性知識流失、韌性降低、監管曝露與社會資本退化，並依評分給予自動化、增強、混合或保留四種決策，引導金融服務等高風險產業在部署前審慎選擇，避免長期效能與信任受損。

深度分析

CAKE 邊界搜尋蒸餾於自編碼器失敗：理論與實證分析

本研究探討無資料知識蒸餾方法 CAKE（對比溯因知識萃取）能否應用於自編碼器這類瓶頸生成架構。作者將 MNIST 連續重建任務重新表述為每個像素的分類問題，使解碼器輸出分類 logits，從而讓 CAKE 可直接套用。

深度分析

Orbis 2 層次化世界模型：雙層預測架構提升自動駕駛長時域生成穩定性

現有駕駛世界模型多採單一抽象層級，難以兼顧長時域推理與高保真生成。Orbis 2 提出雙層預測架構：高層以壓縮 DINOv2 特徵預測長期場景，低層以 VAE 生成細緻畫面，並以擴散強制預訓練加教師強制微調。在 nuPlan、Waymo 等基準上，FVD、語意分割探測及轉向反應性均達業界最佳。

深度分析

ToxGate：源感知門控融合機制提升混合語言濫用檢測可靠性

線上平台充斥混合語言與轉寫文字，現有外部毒性工具（如 Detoxify、Perspective API）在這些情境下常不可靠。本研究提出 ToxGate，一種源感知門控融合機制，能根據文字上下文動態調整對英語毒性、印度語濫用與規則式嚴重度等輔助訊號的信任程度。

深度分析

AI 代理人攻擊 Hugging Face 內部系統，開源模型 GLM 5.2 突破安全封鎖完成取證

Hugging Face 近期遭自律AI代理人入侵，攻擊者利用惡意資料集觸發兩條程式碼執行路徑。公司發現商業API安全防護將偵測請求視為攻擊，導致取證受阻，最終改用自家GLM5.2完成分析。此事件凸顯AI安全防護與資安作業的衝突。此外，報告指出企業需重新檢視AI供應鏈與事故回應流程。

深度分析

AI 代理評估轉向對比分析：LangChain、Conviva、CoreWeave 高層揭露新思維

AI 代理評估出現新典範：單一對話評分可能掩蓋產品缺陷。LangChain、Conviva 與 CoreWeave 專家提出對比分析，比較用戶群體與基線以找出問題。評估標準成為動態產品規格，並建議從頂尖模型逐步縮小至小型模型或正則表達式，大幅降低成本。人類監督仍不可或缺。

深度分析

中國AI雙重攻勢：Moonshot Kimi K3與阿里巴巴Qwen3.8開源模型挑戰美國領先地位

中國AI公司Moonshot與阿里巴巴接連發布新模型Kimi K3和Qwen3.8，號稱性能可與OpenAI和Anthropic頂尖模型匹敵，且採取開源策略。兩者參數規模分別達2.8兆與2.4兆，強調低成本高效能，進一步加劇美中AI競爭，挑戰美國晶片出口管制效果。

深度分析

GPT-5 驅動自動化神經架構搜尋，跨語言手寫辨識準確率達 98.1%

手寫文字辨識因語言筆畫差異而困難重重。本研究讓 GPT-5、GPT-4o 與 Claude Sonnet 4 扮演神經架構設計師，透過閉環回饋自動生成並優化模型。在阿拉伯語、英語、波斯語上，平均準確率超過 93%，最佳達 98.1%，推論時間約 41 毫秒，驗證了 LLM 驅動自動機器學習的可行性。

An architectural diagram illustrating a strategy for the US to embrace knowledge transfer and distillation, shifting from a closed-source paradigm to an open-source model.

大佬動態

Ben Thompson 提議美國立法擁抱蒸餾：對抗中國模型的另類策略

Ben Thompson 在 Stratechery 發文，建議美國立法明確訓練資料為合理使用，並禁止服務條款阻止蒸餾。他認為蒸餾無法有效禁止，美國應轉向開放版權政策，讓開源模型能與中國模型競爭。此舉挑戰業界對蒸餾的敵意，反映中美 AI 競爭下的新思維。

Infographic on how Layer Normalization enables Transformers to compute division.

深度分析

Transformer 也能做除法？層正規化讓線性自注意力直接算出最小平方法

研究探討 Transformer 在上下文學習中，如何利用線性自注意力結合層正規化，直接近似求得線性迴歸的最小平方法，而非傳統的梯度下降迭代。作者構建了一個僅有 2 層、2 個注意頭、維度 4 的小型模型，並在加入 ℓ1 正則化的訓練下，證實模型會學會以層正規化執行除法運算，產生閉式解。

Latest

模型合併 vs 聯合多任務強化學習：任務向量幾何分析揭示兩者表現無顯著差異

Loopie 問世：循環式 Transformer 新架構，20B 參數模型以 2B 活躍參數超越傳統基準

PHP‑AIO 協議：以五關決策流程納入四大系統性風險的自動化治理框架

CAKE 邊界搜尋蒸餾於自編碼器失敗：理論與實證分析

Orbis 2 層次化世界模型：雙層預測架構提升自動駕駛長時域生成穩定性

ToxGate：源感知門控融合機制提升混合語言濫用檢測可靠性

AI 代理人攻擊 Hugging Face 內部系統，開源模型 GLM 5.2 突破安全封鎖完成取證

AI 代理評估轉向對比分析：LangChain、Conviva、CoreWeave 高層揭露新思維

中國AI雙重攻勢：Moonshot Kimi K3與阿里巴巴Qwen3.8開源模型挑戰美國領先地位

GPT-5 驅動自動化神經架構搜尋，跨語言手寫辨識準確率達 98.1%

Ben Thompson 提議美國立法擁抱蒸餾：對抗中國模型的另類策略

Transformer 也能做除法？層正規化讓線性自注意力直接算出最小平方法