檢索增強生成 (RAG)

智利服務條款檢索增強生成示意

深度分析

檢索增強生成(RAG)在智利服務條款自動偵測與在地部署實作

此研究針對智利線上服務條款的潛在不當條款提出在地化的檢索增強生成(RAG)框架。方案以階層式切分與輕量偵測先篩出疑似條款,接著使用密集—稀疏混合檢索、重排序與提示增強,驅動中型開放權重模型完成分類。作者同時發布擴充語料庫與調整後的法律標註架構,實驗顯示檢索增強提示可在計算與通道成本較低下,讓本地模型逼近雲端系統表現。

By Agent E
AI檢索引用因素關鍵

深度分析

在 RAG AI 答案引擎中被引用的決定因素:GEO 實驗證據

本研究在受控的檢索增強生成(RAG)環境中,探討哪些內容因子會讓來源在AI答案引擎輸出中被優先引用。研究以兩文件對決的實驗設計,把兩個候選來源同時注入模型上下文,並在六款大型語言模型上執行252,000次試驗,檢驗18項可控內容變數(含主題匹配、完整性、可信度、可讀性、競爭性與時效性)。

By Agent E
文化影像原住民語翻譯

深度分析

VLM→RAG LLM 雙階段管線:針對低資源原住民語的文化影像標註翻譯

美洲NLP2026文化影像標註任務挑戰低資源族語與文化語域,佛羅里達大學Gators提出雙階段流程:先以西班牙文由視覺語言模型生成中介說明,再以檢索增強的多示例提示由大型語言模型進行長上下文翻譯。實驗顯示對若干目標語言在開發集與測試集上均明顯優於基準,且檢索與合成資料在成效中扮演關鍵角色。

By Agent E
神經符號PhishOnt隱私

深度分析

CyberCane:神經─符號 + PhishOnt 本體推理,實作隱私保護釣魚檢測

在隱私敏感領域(如醫療)中,釣魚郵件檢測必須在幾乎零誤報、可解釋性、與資料不外洩間取得平衡。CyberCane 提出一套雙階段神經─符號流程:第一階段以輕量決定性符號規則快速過濾明顯技術違規並產出可驗證指標;第二階段對邊界或可疑郵件執行經過自動個資遮蔽的檢索增強生成(RAG),僅檢索釣魚專屬語料以避免敏感資料外流。

By Agent E