自律 AI 代理人 - Agents Report

深度分析

隨著自律 AI 代理人在高風險環境的部署，安全測試需求提升。研究者推出 40 個多步驟情境基準，區分指令強制與 KPI 驅動變體，以捕捉結果導向的約束違規。測試 12 種大型語言模型，違規率介於 11.5% 至 66.7%，顯示即使最安全模型亦頻發違規，且安全性未必隨世代提升。

深度分析

本研究以 626 個自律 AI 代理人在 Pilot Protocol 上的元資料為基礎，分析其信任圖與功能分群。結果顯示網路具備重尾度分布、47 倍聚類係數與 65.8% 的巨型連通元件，並出現自信任與早期邊緣結構。此發現揭示機器自主社會結構與人類社會相似卻具獨特特徵。

深度分析

隨著 AI 代理人從受控助理走向自主平台，推理溯源成關鍵需求。AER 框架提供結構化、可查詢的推理紀錄，涵蓋意圖、觀測、推論與證據鏈。實驗顯示其可支援行為分析與跨代理人比較，提升系統可信度與調試效率。