研究:Anthropic 的 Claude 在消費者健康問答中的來源權威行為分析
本研究檢視Anthropic的Claude在回答消費者健康問題時如何呈現引用來源。以HealthSearchQA資料及AuthoritySignalsFramework評估來源權威,發現97.8%為既有機構來源、商業衛教僅2.2%,為Claude醫療應用建立引用基線。
Anthropic的Claude與健康引用行為初探
研究指出,Claude在回覆消費者健康問題時,引用來源高度集中於既有機構,呈現出明顯的來源集中化趨勢。
方法方面,研究以HealthSearchQA資料集為基礎,最終納入3075題並蒐集10038次引用,並採用Authority Signals Framework針對542個來源樣本,檢視四大面向的十項權威信號來評估來源特性。
主要結果顯示,97.8%的引用來自既有機構來源,其中醫療機構、政府資源與專業協會為主要出處,商業衛教僅占2.2%。在聚焦樣本中,商業來源多呈現醫療審核聲明、使用schema標記且內容完整;而傳統機構則可能有或沒有這些標記。研究同時指出,這些發現可作為Claude朝向HIPAA就緒醫療應用時的引用行為基線,並示範Authority Signals Framework在跨平台長期監控AI介入健康資訊來源品質上的實用性。
延伸閱讀
- QuarkMedSearch:針對中文醫療的長航程檢索與可驗證強化學習
- DR‑Venus:在 4B 邊緣模型上以 agentic SFT 與 IGPO 回合層級 RL 實現長時程深度研究代理人
- 以透明篩選框架估算大型語言模型(LLM)推理能源與訓練碳排
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。