SAM2 - Agents Report | 代理人報告

深度分析

ViewSAM：弱監督下的跨視角語意多目標追蹤與視角條件化學習

跨視角語意多目標追蹤（CRMOT）需在多鏡頭間為自然語言指向的目標維持一致身分，但以往方法仰賴大量逐幀空間標註與跨視角身分對應。本文提出弱監督新範式，先以基礎模型（如 SAM3）生成單視角軌跡，透過Affinity-guided Cross-view Re-prompting精煉並對齊成跨視角偽標籤；

深度分析

Remote SAMsing：以多通行自適應門檻與無參數合併，將 SAM2 擴展至大尺度遙測影像分割

遙測影像分割面臨大尺度圖像與物件跨切片碎片化的挑戰。Remote SAMsing 提出一套無需改動 SAM2 或額外訓練資料的開源流程：透過多次通行的自適應門檻策略（先抓高品質遮罩、逐步放寬）與「黑遮罩」簡化殘餘區域，同時以上下文填充與無參數最佳比對合併修補切片邊界，達成高覆蓋與跨切片一致性。

YOLO

AI 驅動足球視覺分析：YOLO 與 SAM2 結合同質映射的場上定位系統

本研究針對足球比賽影片開發電腦視覺分析系統，結合目標偵測、SAM2 分割與關鍵點 CNN 模型，利用同質映射將相機座標轉為實際場地座標，最終產出球員速度、跑動距離與熱點圖等戰術指標，為教練提供可操作的數據。