深度分析 Gen-n-Val:代理人驅動的高品質影像合成與驗證框架 資料稀缺與長尾不平衡持續挑戰視覺任務。Gen-n-Val 結合 LD、LLM 與 VLLM 以代理人方式生成單物件影像與遮罩,並以 VLLM 過濾低質樣本。實驗證明在 LVIS、COCO 與開放詞彙偵測上均顯著提升效能,顯示其在合成資料領域的突破。