深度分析
VS2 與 VS2++:利用稀疏特徵與檢索增強提升 CLIP 零樣本影像分類
在推論端控制視覺基礎模型具挑戰。VS2以top-k稀疏自編碼器抽取可解釋稀疏特徵,推論時放大這些特徵構成steering向量,無需微調或對比資料。VS2++用檢索到的鄰近影像建偽正負群組以選擇性增強差異性特徵。實驗顯示VS2系列可穩定提升零樣本分類準確度。
深度分析
在推論端控制視覺基礎模型具挑戰。VS2以top-k稀疏自編碼器抽取可解釋稀疏特徵,推論時放大這些特徵構成steering向量,無需微調或對比資料。VS2++用檢索到的鄰近影像建偽正負群組以選擇性增強差異性特徵。實驗顯示VS2系列可穩定提升零樣本分類準確度。
速報
學術論文常以圖示說明複雜方法。提出DiagramRAG透過檢索增強把草圖與相容參考結合以補全圖示。技術用知識圖譜與嵌入對齊草圖與圖示。實驗在DiagramBank與FigureBench分別達到F1分數0.848與0.802,並改善生成品質與推論延遲。
速報
研究指出現代人工智慧普遍缺乏元認知。研究提出MetaKGEnrich,一套自動化流程:由種子查詢建構知識圖譜、以七種圖譜指標偵測稀疏區域、生成針對性問題並網路檢索佐證回填,最後擷取並評估回覆品質。實驗在三個公開資料集上顯示多數問題的答案品質獲得提升。