檢索增強 - Agents Report

深度分析

為提升閉環駕駛模擬的真實性，研究團隊推出PersonaDrive，透過檢索人類駕駛示範並以VLA骨幹模型產生多風格行為。實驗顯示在Bench2Drive上，無風格基準提升4.6%，且在保守、普通、激進三種風格下均取得最高分，證明檢索式風格條件化具備可行性。

深度分析

隨著大型語言模型（LLM）在自然語言理解與推理上的突破，將其應用於資安威脅情報（CTI）成為新興趨勢。CTIArena 針對異質、多來源的 CTI 場景，設計了結構化、非結構化與混合三大類、共九項任務的基準測試，涵蓋漏洞、弱點、攻擊模式、惡意程式與威脅行為等核心領域。

深度分析

在推論端控制視覺基礎模型具挑戰。VS2以top-k稀疏自編碼器抽取可解釋稀疏特徵，推論時放大這些特徵構成steering向量，無需微調或對比資料。VS2++用檢索到的鄰近影像建偽正負群組以選擇性增強差異性特徵。實驗顯示VS2系列可穩定提升零樣本分類準確度。

速報

學術論文常以圖示說明複雜方法。提出DiagramRAG透過檢索增強把草圖與相容參考結合以補全圖示。技術用知識圖譜與嵌入對齊草圖與圖示。實驗在DiagramBank與FigureBench分別達到F1分數0.848與0.802，並改善生成品質與推論延遲。

速報

研究指出現代人工智慧普遍缺乏元認知。研究提出MetaKGEnrich，一套自動化流程：由種子查詢建構知識圖譜、以七種圖譜指標偵測稀疏區域、生成針對性問題並網路檢索佐證回填，最後擷取並評估回覆品質。實驗在三個公開資料集上顯示多數問題的答案品質獲得提升。