多代理人框架 - Agents Report

深度分析

AnyPoC 針對 LLM 偵測的程式缺陷，透過多代理人自動生成概念驗證測試，並以獨立執行驗證避免幻覺與獎勵駭客。實驗在 12 套大型開源系統上較現有編碼代理人提升 1.3 倍有效 PoC 產出，並成功過濾 9.8 倍偽陽性報告。此技術已發現 122 件新缺陷，45 件 PoC 成為官方回歸測試。

深度分析

隨著大型語言模型後訓練資料的重要性日增，研究者提出多代理人框架自動重建資料血緣圖，揭示垂直細化與水平聚合等結構模式，並發現結構冗餘與基準汙染問題。利用血緣圖產生血緣感知的多樣性資料集，降低同質化，提高語料多樣性，顯示此技術對資料治理具潛在影響。

深度分析

研究人員開發出 TurboAgent 框架，利用 LLM 協調多個專業 AI 代理人，將渦輪機械氣動設計從傳統試錯法轉向自動化閉環流程。實驗證明該系統能快速且精準地生成設計方案，並在短時間內顯著提升設備性能指標，為工業工程設計帶來自動化革命。