速報
FHIR 上的多步推理:CodeAct 結合強化學習提升臨床問答正確率至 77%
本研究聚焦FHIR醫療資料互通,指出在醫療紀錄圖上做多步篩選與彙整的挑戰。團隊以多回合CodeAct代理結合自訂工具與強化學習後訓練,並用大型語言模型作為判準回饋以維持資料完整性;在FHIR-AgentBench基準上,整體答案正確率由50%提升至77%,且採用更小成本模型達成改進。報告同時提供端到端訓練與評估流程。
速報
本研究聚焦FHIR醫療資料互通,指出在醫療紀錄圖上做多步篩選與彙整的挑戰。團隊以多回合CodeAct代理結合自訂工具與強化學習後訓練,並用大型語言模型作為判準回饋以維持資料完整性;在FHIR-AgentBench基準上,整體答案正確率由50%提升至77%,且採用更小成本模型達成改進。報告同時提供端到端訓練與評估流程。
深度分析
用藥核對是臨床交接中高風險的流程,研究比較四種 FHIR 資料序列化策略(Raw JSON、Markdown 表格、臨床敘事、時間軸)對大型語言模型在合成病歷上執行藥物擷取的影響。