SymptomAI:對話式人工智慧完成全流程問診與差異診斷實測
ArXiv 團隊透過 Fitbit 應用部署 SymptomAI,讓 13,917 名真實穿戴裝置使用者隨機與五款對話式代理人互動,取得日常症狀對話與疾病分布。1,228 人回報臨床診斷,517 筆對話由臨床小組耗時評註。
重點速報
SymptomAI 在真實世界問診的表現超出預期。研究在 Fitbit 應用中,將 13,917 名使用者隨機分配給五款對話式 AI 代理人,進行端到端的問診與差異診斷。
方法與驗證
團隊蒐集多樣化對話語料,並以 1,228 名回報臨床診斷的使用者為標的,其中 517 筆對話由臨床小組花逾 250 小時評註。研究在盲測設定下,比較 SymptomAI 給出的差異診斷與獨立臨床醫師基於相同對話的判斷。
主要發現
採用專門症狀訪談的 agentic 策略顯著優於以使用者導向討論為主的基線方法,整體差異診斷準確度在盲測中高於臨床醫師(OR=2.47,p<0.001)。此外,對 1,509 筆外部一般族群對話的分析,支持結果可外推。
進一步以 SymptomAI 的診斷標籤分析穿戴裝置逾 50 萬天的生理資料,發現急性感染與多項生理指標出現強烈關聯,例如流感相關指標的 OR>7。研究指出,完整且結構化的問診流程可提升 AI 在日常症狀評估的實用性。
延伸閱讀
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。