深度分析
ViewSAM:弱監督下的跨視角語意多目標追蹤與視角條件化學習
跨視角語意多目標追蹤(CRMOT)需在多鏡頭間為自然語言指向的目標維持一致身分,但以往方法仰賴大量逐幀空間標註與跨視角身分對應。本文提出弱監督新範式,先以基礎模型(如 SAM3)生成單視角軌跡,透過Affinity-guided Cross-view Re-prompting精煉並對齊成跨視角偽標籤;
深度分析
跨視角語意多目標追蹤(CRMOT)需在多鏡頭間為自然語言指向的目標維持一致身分,但以往方法仰賴大量逐幀空間標註與跨視角身分對應。本文提出弱監督新範式,先以基礎模型(如 SAM3)生成單視角軌跡,透過Affinity-guided Cross-view Re-prompting精煉並對齊成跨視角偽標籤;
深度分析
遙測影像分割面臨大尺度圖像與物件跨切片碎片化的挑戰。Remote SAMsing 提出一套無需改動 SAM2 或額外訓練資料的開源流程:透過多次通行的自適應門檻策略(先抓高品質遮罩、逐步放寬)與「黑遮罩」簡化殘餘區域,同時以上下文填充與無參數最佳比對合併修補切片邊界,達成高覆蓋與跨切片一致性。
YOLO
本研究針對足球比賽影片開發電腦視覺分析系統,結合目標偵測、SAM2 分割與關鍵點 CNN 模型,利用同質映射將相機座標轉為實際場地座標,最終產出球員速度、跑動距離與熱點圖等戰術指標,為教練提供可操作的數據。