原子化事實核查(atomic fact‑checking)顯著提升臨床對 AI 建議的信任
這項隨機試驗比較原子化事實核查與傳統可解釋性方法對臨床信任的影響。研究把AI建議分解為可逐一驗證且連結原始指引的聲明,結果發現原子化事實核查將表達信任的臨床人員比例從26.9%提高到66.5%,傳統透明機制則呈劑量反應改善,效果量介於0.25到0.50之間。
原子化事實核查提高臨床信任
一項隨機試驗針對356名臨床人員、共產生7,476次信任評分,直接比較原子化事實核查與傳統可解釋性做法對信任的影響。試驗發現原子化事實核查帶來顯著提升,效果量(Cohen’s d)為0.94。
研究方法是把 AI 的處置建議拆成可逐一驗證、並連結回原始指引文件的獨立聲明,讓醫師能針對每一條主張核對來源。這種做法強調把複合建議解構為可檢驗的小單位,並標註對應的指引證據,降低單一黑盒解釋造成的模糊感。
相較之下,傳統的透明化或可解釋性機制雖然也提高了信任,但改善幅度較小,呈現劑量反應型的漸進提升,效果量介於0.25到0.50之間。
結論是,在高風險臨床決策場景,將 AI 建議分解並直接對照指引,可比一般可解釋性措施更大幅提高臨床人員的信任,對推動醫療領域中 AI 的實務採用具有實質意義。
延伸閱讀
- QuarkMedSearch:針對中文醫療的長航程檢索與可驗證強化學習
- DR‑Venus:在 4B 邊緣模型上以 agentic SFT 與 IGPO 回合層級 RL 實現長時程深度研究代理人
- 以透明篩選框架估算大型語言模型(LLM)推理能源與訓練碳排
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。