深度分析 MedAgentAudit 實證:基於 LLM 的醫療多代理協作失靈與量化稽核框架 MedAgentAudit 針對多代理大型語言模型在醫療任務中的協作過程進行大規模實證稽核。研究以 3,600 筆互動紀錄、六個醫療資料集與六套代表性多代理框架為基礎,結合質性標註與量化追蹤,提出一套協作失效分類法並量化常見崩解模式。