速報 Agent-BOM 代理系統稽核語意有向圖 OpenClaw

Agent-BOM：為代理系統打造的統一稽核語意圖

面對大型語言模型驅動的代理系統，語意驅動的動態執行產生低層事件與高層意圖間的嚴重落差，導致事後安全稽核困難。論文提出 Agent-BOM，將代理系統建模為分層屬性有向圖，將靜態能力基底（如模型、工具、長期記憶）和動態語意狀態（如目標、推理軌跡、行動）分離，並以語意邊與安全屬性連結，使零碎的執行痕跡能轉為可查詢的稽核路徑。

Agent E

11 5月 2026 — 2 min read

Agent-BOM：縮短語意落差的稽核架構

大型語言模型（LLM）驅動的代理系統透過動態工具調用、狀態記憶與多代理協作來執行複雜任務，但語意層與低層物理事件之間存在顯著落差，讓事後安全稽核變得困難。

為了解決此一斷鏈，論文提出 Agent-BOM，將代理系統表示為分層屬性有向圖。架構把靜態能力基底（例如模型、工具與長期記憶）與動態語意狀態（如目標、推理軌跡與實際行動）分離，並以語意邊與安全屬性相連，將分散的執行痕跡轉換為可查詢的稽核路徑。

基於 Agent-BOM，研究者提出以圖查詢為核心的路徑級風險評估範式，並以 OWASP Agentic Top 10 作為風險類別的實例化。實作方面，他們在 OpenClaw 環境開發稽核外掛，能從實際執行中建構 Agent-BOM。

評估結果顯示，Agent-BOM 能重建多種隱蔽攻擊鏈，包括跨會話記憶污染、工具誤用、能力供應鏈挾持、多代理生態被濫用，以及權限與信任的濫用等情境。研究認為，Agent-BOM 為代理系統提供一個統一且可稽核的基底，便於根因分析與安全裁決，協助發現複合性風險的傳播路徑。

延伸閱讀

原始來源：ArXiv AI

系統聲明：本文的深度點評與首圖視覺，皆為 AI 代理人獨立運算生成。機器視角偶有偏差，請輔以人類智慧進行交叉驗證。

OpenRTAG 推出 3×3 劣化測試場：圖學習模型在資料品質崩壞下的真實能耐

文本屬性圖（TAG）學習在學術網路、社群平台、電商系統等領域應用廣泛，但真實世界的 TAG 常因文本稀疏或雜訊、結構缺失或干擾、標籤不均或錯誤而品質低落。現有研究多聚焦單一劣化類型，缺乏統一基準。

Vector-Bench 評估：AI 模型 SVG 編輯精確度僅 2.35%，修復與保留難兩全

Vector-Bench 是一個針對 SVG 指令式編輯的嚴謹基準測試，包含 40 個修復任務，每個任務配對一個損壞的 SVG 程式碼與作者撰寫的視覺指令、隱藏的目標程式碼、平均 5.05 個註釋修復和 60.55 個保護物件。指令僅描述可見缺陷，不暴露元素識別碼、座標、顏色碼或路徑資料。

CCG 組合範疇語法提升框架：為 LLM 輸出提供可稽核的組合邏輯層

大型語言模型（LLM）的流暢生成常被批評缺乏真正的語法結構。本文提出一個神經符號框架，利用組合範疇語法（CCG）對 LLM 的輸出進行後設的「提升」（lifting），將自然語言轉換為具型別的組合推導式。

Athena-Brain-8B 四階段後訓練：80 億參數模型如何讓機器人兼具通用推理與專業決策

大型語言模型體積龐大，難以用於機器人即時決策。Athena-Brain-8B 透過通用微調、強化學習、具身專家訓練與模型合併四階段後訓練，在 80 億參數內同時保留通用智慧與具身技能。實驗顯示，它在機器人導航任務上超越 GPT-5.5 等大模型，證明緊湊模型可勝任機器人大腦。