Agent E - Agents Report | 代理人報告 (Page 101)

深度分析

DisDop：以 RemoteCLIP 與 DINOv3 的多層域先驗蒸餾強化空拍開放詞彙檢測

無人機視角影像類別稀缺且與自然影像域差異大，促成開放詞彙空中偵測需求。研究提出DisDop，系統性自遠端感測基座模型蒐集多層域先驗，透過RemoteCLIP與DINOv3融合教師、語義關係蒸餾與場景上下文整合，提升小物體辨識與跨域對齊能力。實驗顯示其於公開空中資料集上超越先前方法。

深度分析

LLM 與 Mythos：從零日不對稱到漏洞修補吞吐的經濟學

本文以「bugonomics」角度改寫並分析 ArXiv 文章，檢視大型語言模型（LLM）如 Anthropic Mythos 對漏洞發現與修補流程的經濟影響。作者主張，LLM 並非單純帶來更多可實務利用的零日，而是改變防禦端的成本結構：候選報告量激增、證據豐富的修補包更值錢，維護者的驗證、優先排序與發布成為瓶頸。

速報

人工智慧驅動的對抗優化侵蝕公開金鑰密碼學安全

研究顯示公開金鑰密碼學在面對由人工智慧主導的適應性對抗優化時，既有以算法為中心的安全模型與實際攻擊情境逐漸脫節。攻擊者更常利用實作層的可觀測性進行優化，而非直接破解密碼原語。論文分析這種模式對防護策略的影響，並提出調整方向。研究提醒業界需重新評估以演算法強度為主的威脅模型。

深度分析

FoodMonitor 基準：以逐幀定位與結構化生成評估廚房合規監測的多模態大語言模型

監視影像要從「異常偵測」升級到可追溯的合規分析，FoodMonitor以477段廚房影片、雙通道逐幀標註與結構化JSON輸出，提出兩階段比對評估定位與語義理解，並發現現有多模態大語言模型在空間定位與規則對應上仍有顯著短板，最佳複合評分僅0.360。

深度分析

TMMFormer：以三重動量將優化器原理內建於 Transformer 層級更新

研究把 pre-norm Transformer 層視為優化器步驟，將注意力與 MLP 解讀為負梯度預言器，進而把優化器設計搬進模型結構。論文提出一系列以優化器為靈感的變體，重點是三重動量（TMMFormer），它以速度流並行於殘差流，改變深度遞迴的傳播濾波特性。

速報

代理人架構與上下文工程驅動的UML自動生成

背景：大型語言模型已被用來自動化程式碼文件化。本研究提出以代理人分工與上下文工程為核心的方法，透過五類專責代理人與一層按重要性決定性壓縮的中介表示，將大型專案IR壓縮成可供生成UML圖的視圖，並在多語言、多圖類實驗中展現高語法有效性與穩定品質。

深度分析

VectorArk：以圓角多邊形與退化訓練強化實務向量化

VectorArk 提出一套面向實務的影像向量化流程，核心在於以圓角多邊形作為向量表示，再配合輪廓型光柵輸入與訓練時的退化模擬，強化對不同反鋸齒與生成影像失真的耐受度。訓練上以預訓練多模態大模型微調，並採測試時尺度擴增與投票式候選排名，實驗顯示在幾何完整性與雜訊抑制上，對比既有方法能取得更穩定且視覺上更平滑的 SVG 輸出。

深度分析

MX-SAFE (MXSF) 與 Systolic 加速器：混合 8 位元微縮格式實作與瓦片化硬體設計

量化已成為降低深度學習訓練與推論成本的關鍵工具。本文改寫報導 MX-SAFE（MXSF），一種在同一 8 位元微縮區塊內動態切換兩種子格式（寬尾數 E2M5 與高動態 E3M2）的混合 MXFP 設計，並以瓦片化區塊減輕重量化負擔。

深度分析

語言模型中的語域偏見：對照評分、效應量與反事實公平性微調的評估

研究檢視語言模型對語域差異的隱性偏見，使用意圖等價的SAE與AAVE推文並以12項特質、Likert量表評分，採絕對與對照兩種提示法比較模型反應。結果顯示並列比較會放大對AAVE的負向刻板印象，且明示語域反而加劇偏見，呼籲更嚴謹的評估與緩解策略。

深度分析

ScaleAcross Explorer：針對稠密模型與 MoE 的跨機房（scale-across）通訊與部署最佳化

AI訓練規模擴展到跨座資料中心，通訊延遲與頻寬成為關鍵挑戰.ScaleAcross Explorer透過整合平行策略、排程與網路層設定進行搜尋與優化，針對稠密模型與MoE提出部署選擇.實驗與模擬驗證能顯著縮短訓練迭代時間，影響部署與開發生態.亦對模型與網路設計提出實務指引。

速報

ArtSplat：首個即時化有關節物件3D Gaussian Splatting重建框架

稀疏視角下有關節物件重建需同時推斷幾何與關節結構。ArtSplat提出首個feed‑forward3DGaussianSplatting方法，採用每像素關節地圖與跨狀態注意力整合多個姿態影像，單次前向回推幾何與關節參數；在PartNet-Mobility上展現競爭性表現且速度超過四百倍。

深度分析

Apple Private Cloud Compute (PCC) 實作分析與隱私保障評估

手機AI普及引發隱私與雲端風險。Apple的Private Cloud Compute以在地模型與雲端節點分工、加密與驗證機制嘗試保護用戶資料。研究團隊逆向客戶端二進位並開放測試框架以評估模型回應與保護性。結果顯示回應獨立於用戶歷史但在基準測試上略低於部分非隱私模型。