volumetric-reasoning-segmentation - Agents Report

深度分析

MedVol-R1：以二維證據錨點與 GRPO 強化三維體素分割

Volumetric Reasoning Segmentation（VRS）在臨床問句下，需把隱含的參照物從語意轉為三維體素級遮罩。MedVol-R1 提出以強化學習驅動的二階段流程：先讓大視覺語言模型（LVLM）回應可驗證的二維證據錨點（關鍵軸向切片與二維邊界框），再由固定的 MedSAM2 將其向跨切片延展成一致的三維遮罩。