深度分析 ViCrop-Det:利用空間注意力熵提升小目標偵測效能的訓練免除方法 在自然影像的空間異質性下,Transformer會出現注意力稀釋,導致小目標特徵退化。ViCrop-Det以偵測解碼器的交叉注意力熵作為不確定性指標,動態聚焦高熵區域並以高解析度重新推論。實驗顯示於VisDrone、DOTA‑v1.5皆提升1‑3mAP,且僅增加約20%延遲。此策略可作為現有Transformer偵測器的即插即用升級,為高解析度影像應用提供更佳小目標辨識能力。