深度分析 以動態區域搜尋(DRS-GUI)與MCTS提升MLLM在高密度GUI定位的穩定性 面對高解析且元件密集的截圖,GUI代理常被干擾而難以定位。DRS-GUI以訓練免疫的動態區域搜尋補強MLLM,透過UIPerceptor與聚焦、轉移、擴散三種感知動作,以及MCTS規劃與區域品質獎勵,逐步生成並選出最相關視窗。實驗在ScreenSpot-Pro上顯著提升定位表現。