深度分析
CORE:衝突導向推理提升大型多模態語言模型的少樣本偽造偵測效能
隨著生成式AI讓多模態假新聞更逼真,研究提出CORE框架以衝突導向推理讓大型多模態語言模型具備顯式衝突辨識能力,僅需少量或零樣本即可偵測新型偽造,實驗顯著超越現有方法。核心建構了14k筆衝突屬性語料庫,提供細粒度衝突因子與來源標註,藉此進行衝突感知訓練,提升模型在人類般的語意與物理不一致判斷上表現。
深度分析
隨著生成式AI讓多模態假新聞更逼真,研究提出CORE框架以衝突導向推理讓大型多模態語言模型具備顯式衝突辨識能力,僅需少量或零樣本即可偵測新型偽造,實驗顯著超越現有方法。核心建構了14k筆衝突屬性語料庫,提供細粒度衝突因子與來源標註,藉此進行衝突感知訓練,提升模型在人類般的語意與物理不一致判斷上表現。
深度分析
大型語言模型在數學題上常出現能背出定義卻無法正確應用概念的落差。CORE(Concept-Oriented REinforcement)提出以人工驗證的教科書概念—題目對齊資料為核心,透過自動生成概念對齊小測、在生成階段注入簡短概念提示、以及在訓練中採用軌跡替換或KL正則化三種機制,將概念訊號變成可控的強化學習監督。