深度分析 HiDe:以分層解耦(Hierarchical Decoupling)結合 TAD/LPD 提升 MLLM 高解析度理解 面對MLLM在高解析度影像上表現不佳的問題,研究以分層解耦分析指出背景干擾而非物體尺寸是主因。提出HiDe結合TAD淨化注意力與LPD保留佈局進行重建,達到更精準的目標對齊與裁切。實驗顯示HiDe在多項HR基準上成為新的SOTA,並顯著降低記憶體使用。