放射科人工智慧 - Agents Report

視覺語言模型

本研究針對胸部X光報告自動化的臨床落差，提出以放射科醫師視線追蹤作為行為先驗的基礎視覺語言模型GazeX。模型在超過30,000個視線關鍵影格與231,835例影像上預訓練，顯著提升報告生成、病灶定位與視覺問答的準確性與可解釋性，並提供檢視軌跡作為驗證依據。