Apollo:以時序病歷整合全模態的醫療基礎模型
Apollo 是一個多模態、時序化的醫療基礎模型,訓練資料來自美國大型醫院系統逾三十年的病歷資料,涵蓋250億筆紀錄與720萬名病患、28種醫療模態與12個主要專科。模型將超過十萬種臨床事件、影像與文字統一成向量表徵,形塑一個醫療概念圖譜,並把整段病程壓縮為虛擬病人表示。
Apollo:整合全模態的時序病歷基礎模型
Apollo以長期、跨系統的臨床紀錄為基礎,提出把整段病程壓縮為可運算的「虛擬病人」表示,讓整體照護脈絡能被機器理解與推理。
研究使用美國大型醫院系統逾三十年的病歷資料,涵蓋數十億筆紀錄、720萬名病患、28種醫療模態與12個主要專科。Apollo在同一表示空間內整合超過十萬種臨床事件、影像與文字,構築一份醫療概念圖譜,將序列化的結構化與非結構化事件一併編碼。
為驗證這套全病人表徵的效力,團隊從保留測試集設計322項預後與檢索任務,橫跨疾病發生風險預測、病程進展、治療回應、不良事件風險到醫院營運指標。實驗顯示,Apollo嵌入向量在多項預測任務具泛化能力,並且在語義相似度檢索與以文字、影像為查詢的多模態檢索上有應用潛力。
透過特徵歸因分析,模型的重要預測來源可對應到臨床可解釋的多模態生物標記,顯示其在可解釋性與臨床線索挖掘上的價值。整體而言,Apollo為可計算醫學(computable medicine)提供一種把完整照護歷程變為可供運算推理之基礎設施的路徑。
延伸閱讀
- QuarkMedSearch:針對中文醫療的長航程檢索與可驗證強化學習
- DR‑Venus:在 4B 邊緣模型上以 agentic SFT 與 IGPO 回合層級 RL 實現長時程深度研究代理人
- 以透明篩選框架估算大型語言模型(LLM)推理能源與訓練碳排
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。