大型語言模型
EvoSci:以大型語言模型、多代理人協作與知識圖譜驅動的演化式科學探索
EvoSci 提出一套以多角色代理人為核心的科學探索框架,將生物演化概念與知識圖譜整合,讓研究構想能在多輪循環中被生成、評估與精煉。系統定義導師、研究員群組與審稿人等角色,透過協作推理、共享記憶與動態任務分配,支援長期、跨領域的議題演化。
大型語言模型
EvoSci 提出一套以多角色代理人為核心的科學探索框架,將生物演化概念與知識圖譜整合,讓研究構想能在多輪循環中被生成、評估與精煉。系統定義導師、研究員群組與審稿人等角色,透過協作推理、共享記憶與動態任務分配,支援長期、跨領域的議題演化。
速報
研究以一個迭代式多回合協商遊戲檢驗多代理大型語言模型(LLM)的互動能力。兩名代理人在共享資源上為各自私人專案協商,可驗證共同最優解;然而實驗發現,多數代理組合無法收斂到帕雷托最優。研究識別出四種失敗型態:缺乏共享互動歷史導致協調崩解;累積上下文引發僵化錨定;偏好表面公平(平均分)取代報酬最大化;
深度分析
面對深度推理與廣度彙整的雙重挑戰,Web2BigTable 採用雙層架構與跑驗證反思閉環,讓上層指令分解與下層平行工作者協同運作,並以共享工作板減少重複探索。實驗在 WideSearch 上取得 38.5% Avg@4 成功率,Row F1 63.53%,Item F1 80.12%,亦在 XBench‑DeepSearch 達到 73% 正確率,顯示其在廣度與深度搜尋皆具優勢。
速報
本研究提出一套由五個代理人組成的統一架構,能自動從資料集與自然語言目標產出端對端機器學習管線。系統結合代碼為基礎的檢索增強生成(RAG)以理解微服務,並使用可解釋的混合推薦演算法選擇最佳組件。透過大型語言模型進行錯誤詮釋與自我修復,並從執行歷史中自適應學習。
速報
LLMs在精神醫療有潛力但常缺臨床推理與情感溝通。WiseMind以多代理人設計:理性心負責循證判斷、情感心負責共情表達,並以DSM-5導向的結構化知識圖引導問診,顯著降低幻覺生成。系統在模擬與真人測試達到85.6%首位診斷準確率,優於單代理基線。
深度分析
Google ADK 推出多代理人資料分析管線,結合安全 API 設定與集中式資料庫,提供載入、探索、統計測試、視覺化與報告產出等工具。主分析代理人協調各子代理人完成端到端分析流程,提升可擴充性與效率。此框架有望改變 AI 產業的分析開發模式。