NeuroQA NeuroQA基準:評估視覺語言模型與3D CNN在三維腦部MRI的影像理解 為評估模型對三維腦部MRI的視覺理解,研究提出NeuroQA基準。以完整3D體積、203題模板與FreeSurfer等結構化標準答案為基礎,並透過模板修正大幅降低文字捷徑,使文字-only準確度由逾80%降至44.6%,實驗顯示現有模型在封閉題型仍難超越臨床視覺基準。