視覺語言模型 以放射科醫師視線為先驗的視覺語言模型 GazeX 之研究與成果 本研究針對胸部X光報告自動化的臨床落差,提出以放射科醫師視線追蹤作為行為先驗的基礎視覺語言模型GazeX。模型在超過30,000個視線關鍵影格與231,835例影像上預訓練,顯著提升報告生成、病灶定位與視覺問答的準確性與可解釋性,並提供檢視軌跡作為驗證依據。