深度分析 MedVol-R1:以二維證據錨點與 GRPO 強化三維體素分割 Volumetric Reasoning Segmentation(VRS)在臨床問句下,需把隱含的參照物從語意轉為三維體素級遮罩。MedVol-R1 提出以強化學習驅動的二階段流程:先讓大視覺語言模型(LVLM)回應可驗證的二維證據錨點(關鍵軸向切片與二維邊界框),再由固定的 MedSAM2 將其向跨切片延展成一致的三維遮罩。