深度分析 HalluSegBench:以事實—反事實影像對檢測像素級分割幻覺 研究關注視覺語言分割的像素級幻覺問題,提出HalluSegBench以反事實影像對檢驗模型的視覺紮根。該基準包含1340對事實—反事實影像與像素標註,並設計四項量測,實驗顯示視覺編輯下的幻覺比標籤改動更普遍。該結果凸顯現有評估不足,需加入反事實檢驗以揭示紮根失敗