速報
MICE:為社群貼文打造的多模態主張擷取與意圖感知框架
自動化事實查核仰賴主張擷取,但社群貼文常把短文與迷因、截圖或照片混合,挑戰不同於純文字或傳統視覺任務。該研究提出首個針對社群多模態主張擷取的基準資料集,採用由真人查核者標註的貼文主張,並以語意對齊、真實性與去文脈化三向度評估多模態大型語言模型。
速報
自動化事實查核仰賴主張擷取,但社群貼文常把短文與迷因、截圖或照片混合,挑戰不同於純文字或傳統視覺任務。該研究提出首個針對社群多模態主張擷取的基準資料集,採用由真人查核者標註的貼文主張,並以語意對齊、真實性與去文脈化三向度評估多模態大型語言模型。
多模態LLM
MM-Telco 提出一套專為電信領域設計的多模態基準與公開資料集,覆蓋 3GPP Release 17 相關文件,並整合文字問答、影像分類、檔案檢索與 PCAP 分析等十項任務。作者對多款現有 LLM/VLM 做基線評測,並提供微調實驗與一個名為 Llama-VL-Telco 的圖像生成與更新模型範例。