多代理人 - Agents Report

深度分析

多代理人 RAG 平台 Carolina Guide 提升大學政策查詢效率與安全防護

在大學學務諮詢常見資訊瓶頸下，Carolina Guide 以多代理人檢索增強生成系統，結合關聯式資料庫與向量索引、硬性安全防護與必備引用，於90筆測試中達成98.9%檢索成功與0.89安全F1，展現校內政策輔助的可行性。系統亦支援即時回應與部門自治的維護機制，確保政策更新可即時反映於服務。

深度分析

多代理人協作的 HENA 迴路：ATHENA 在科學計算與 SciML 的突破

為縮短科學計算與機器學習之理論與實作落差，研究提出ATHENA多代理人框架，採用HENA迴路將研究流程建模為情境式賭徒問題，藉由概念腳手架限制行動空間並以無遺憾策略自動選擇最佳數值方法，於基準測試達到10⁻¹⁴級誤差，並在人工協作模式下提升成果十倍。

深度分析

LectūraAgents 多代理人框架結合 TASA 演算法實現具身個人化 AI 輔助學習

隨著個人化 AI 輔助學習需求提升，LectūraAgents 以教授‑學生式層級多代理人架構，結合 Teaching Action‑Speech Alignment 演算法與具身教學動作，支援即時問答與學習者記憶追蹤，在多模態投影片上同步呈現手寫標記與語音說明，實驗顯示其個人化與具身教學指標均優於現有多代理人系統，預示教育 AI 可能從純文字交互轉向全感官教學。

大型語言模型

EvoSci：以大型語言模型、多代理人協作與知識圖譜驅動的演化式科學探索

EvoSci 提出一套以多角色代理人為核心的科學探索框架，將生物演化概念與知識圖譜整合，讓研究構想能在多輪循環中被生成、評估與精煉。系統定義導師、研究員群組與審稿人等角色，透過協作推理、共享記憶與動態任務分配，支援長期、跨領域的議題演化。

速報

動態語意建立揭示多代理協商缺口：LLM 多回合資源分配失靈

研究以一個迭代式多回合協商遊戲檢驗多代理大型語言模型（LLM）的互動能力。兩名代理人在共享資源上為各自私人專案協商，可驗證共同最優解；然而實驗發現，多數代理組合無法收斂到帕雷托最優。研究識別出四種失敗型態：缺乏共享互動歷史導致協調崩解；累積上下文引發僵化錨定；偏好表面公平（平均分）取代報酬最大化；

深度分析

Web2BigTable 雙層記憶體驅動多代理人框架提升廣度與深度搜尋效能

面對深度推理與廣度彙整的雙重挑戰，Web2BigTable 採用雙層架構與跑驗證反思閉環，讓上層指令分解與下層平行工作者協同運作，並以共享工作板減少重複探索。實驗在 WideSearch 上取得 38.5% Avg@4 成功率，Row F1 63.53%，Item F1 80.12%，亦在 XBench‑DeepSearch 達到 73% 正確率，顯示其在廣度與深度搜尋皆具優勢。

速報

多代理人自動化機器學習管線：結合代碼驅動 RAG 與自我修復機制

本研究提出一套由五個代理人組成的統一架構，能自動從資料集與自然語言目標產出端對端機器學習管線。系統結合代碼為基礎的檢索增強生成（RAG）以理解微服務，並使用可解釋的混合推薦演算法選擇最佳組件。透過大型語言模型進行錯誤詮釋與自我修復，並從執行歷史中自適應學習。

速報

WiseMind：結合理性與情感的多代理人精神科評估系統

LLMs在精神醫療有潛力但常缺臨床推理與情感溝通。WiseMind以多代理人設計：理性心負責循證判斷、情感心負責共情表達，並以DSM-5導向的結構化知識圖引導問診，顯著降低幻覺生成。系統在模擬與真人測試達到85.6%首位診斷準確率，優於單代理基線。

深度分析

Google ADK 多代理人資料分析管線完整教學：從資料載入到報告生成

Google ADK 推出多代理人資料分析管線，結合安全 API 設定與集中式資料庫，提供載入、探索、統計測試、視覺化與報告產出等工具。主分析代理人協調各子代理人完成端到端分析流程，提升可擴充性與效率。此框架有望改變 AI 產業的分析開發模式。