視覺證據 - Agents Report

深度分析

隨著Video‑LLM在長影片推理上的突破，研究提出CoVER框架，結合查詢擴充取得多元視覺證據與答案線索驅動的視覺回饋驗證，形成閉環推理流程。實驗顯示在MLVU、LVBench等基準上提升3至5個百分點，顯示完整證據取得與答案驗證對長影片理解的關鍵價值。