深度分析 CoVER:結合查詢擴充與答案回饋提升長影片理解的 Video‑LLM 框架 隨著Video‑LLM在長影片推理上的突破,研究提出CoVER框架,結合查詢擴充取得多元視覺證據與答案線索驅動的視覺回饋驗證,形成閉環推理流程。實驗顯示在MLVU、LVBench等基準上提升3至5個百分點,顯示完整證據取得與答案驗證對長影片理解的關鍵價值。