深度分析 - Agents Report | 代理人報告 (Page 39)

深度分析

AI 幻覺與供應鏈安全：Slopsquatting 攻擊手法與防禦策略

隨著大型語言模型（LLM）在程式開發中的廣泛應用，AI 幻覺產生的虛構套件名稱正成為供應鏈攻擊的切入口。研究指出，攻擊者可註冊這些幻覺套件，將惡意程式碼注入開發者的專案，形成所謂 Slopsquatting。

深度分析

OpenAI 推出 ChatGPT Work：基於 GPT‑5.6 的雲端 AI 代理平台

OpenAI於2026年7月推出ChatGPTWork，將聊天機器人升級為能跨電郵、行事曆、Slack與GitHub執行多步驟任務的雲端AI代理。核心使用GPT‑5.6、持久雲端虛擬機與MCP插件，支援手機上即時建立網站。此舉標誌OpenAI從問答工具轉型為企業工作平台，可能重塑生產力格局。

深度分析

企業部署 AI 代理人測試挑戰與 AWS、Couchbase、Microsoft 上下文治理方案

企業AI代理人部署迅速，卻面臨測試驗證不足的評估缺口。調查顯示半數企業在內部測試通過後仍出錯，且僅5%完全信任自動評分。此情形促使未來資安與治理工具成為投資重點企業將在未來一年投入資源改造評估平台，並優先採用重複性測試與回歸驗證，以縮小自主化與可信度之落差。

深度分析

StateLinFormer：線性注意力與持續記憶訓練提升長程導航與 In‑Context Learning

隨著機器人導航需求提升，傳統SLAM與固定窗口Transformer受限於記憶長度。研究提出StateLinFormer，以線性注意力結合跨批次持續記憶訓練，使模型在無限序列近似下保有長期資訊。實驗顯示在Maze與ProcTHOR環境中，其成功率與步數均顯著優於同規模基線。

深度分析

MasFACT：結構記憶與 FGW 對齊的持續多代理拓撲學習方法

MasFACT 提出一套幾何感知的後驗證轉移機制，專為大型語言模型驅動的多代理系統（MAS）在持續任務流中防止拓撲遺忘而設計。透過融合 Gromov‑Wasserstein 最適傳輸將歷史高效合作結構作為可轉移的拓撲先驗，並以 PAC‑Bayes 引導的保守後驗調整平衡新任務的可塑性與結構的穩定性。

深度分析

即時監測 VLM 流程圖轉碼品質：OCR 與視覺蘊涵雙指標評估方法

隨著視覺語言模型被廣泛用於流程圖圖像轉程式碼，缺少參考碼使品質監控困難。研究提出以OCR產生文字作為參考的Recall_OCR，並以視覺蕴涵驗證生成內容的Precision_VE，合成F1_OCR-VE作為品質指標。實驗在FlowVQA上驗證，與真實指標相關係數分別達0.97、0.91、0.94。

深度分析

自監督視覺Transformer與Gram矩陣蒸餾提升自然場景類人物體分組行為

研究以自然場景點對判斷測試人類物體分組，採用自監督Transformer（DINO系列）與監督模型比較，發現自監督模型在預測反應時間與同物體優勢上更貼近人類行為，顯示Gram矩陣結構提升感知對齊。此外，透過將監督模型的Gram矩陣蒸餾至自監督模型，可進一步提升其物體中心性與行為對齊度。

深度分析

LLM 驅動的 Self-EvolveRec：透過使用者模擬器與診斷工具提升推薦效能

隨著線上資料激增，傳統推薦系統設計受限於固定搜尋空間。研究提出 Self-EvolveRec，結合使用者模擬器與模型診斷工具，提供方向性回饋。實驗顯示其在效能與使用者滿意度上均顯著優於現有 NAS 與 LLM 演化基線。此技術有望重塑推薦系統自動化流程。

深度分析

神經鏈與離散動力系統：與 PINN 及有限差分求解 PDE 的深度比較

本篇報導深入剖析不含自注意力的 transformer 變體——神經鏈（Neural Chains），並將其與離散動力系統的數值解法以及物理感知神經網路（PINN）作系統性比較。

深度分析

Token-Domain Multiple Access (ToDMA)：結合多模態大模型的 6G 語義通信新框架

面對 6G 海量設備連接的挑戰，研究人員提出 ToDMA 語義多重接取方案。該技術將數據 Token 化後利用共享碼本傳輸，接收端則透過壓縮感知檢測活動 Token，並結合多模態大模型利用上下文預測來補全碰撞遺失的 Token。實驗結果顯示，ToDMA 的傳輸延遲較正交方案降低四倍，顯著提升了多模態數據在未來無線網路中的傳輸效率與重建品質。

深度分析

「ContextSniper」：透過混合檢索與意圖感知門降低程式庫修復 Token 消耗

隨著大型語言模型被用於程式庫層級的錯誤修復，ContextSniper 透過意圖感知的上下文門將冗長的讀檔與指令輸出濾除，只保留關鍵程式碼與執行證據。實驗顯示，於 SWE‑bench Lite 測試中，OpenClaw 與 Claude Code 的 token 使用分別下降 51.5% 與 38.9%，成本亦同步降低。

深度分析

「SHARP」睡眠階層加速重放提升長距離非平穩時間序列辨識效能

針對串流環境中長距離非平穩時間模式的學習挑戰，研究提出 SHARP 框架，結合記憶模組與模式辨識模組，並在離線睡眠階段以加速重放強化記憶。實驗在 text8 與 PG‑19 上顯示，該方法在保持先前資料預測表現的同時，提升了未來資料的泛化能力並降低了計算成本。