速報
預訓練語言模型讓知識圖譜實體向量更泛化:鏈結預測與跨任務遷移表現提升
知識圖譜常有缺漏,研究用文字描述學習實體向量以支援鏈結推斷與檢索。採用預訓練語言模型以鏈結預測目標學習向量表徵,並在未見實體的誘導式鏈結預測、實體分類與實體導向檢索三項任務上驗證泛化能力。結果顯示鏈結預測MRR平均提升22%,分類準確度平均增16%,檢索NDCG@10最高增8.8%。
速報
知識圖譜常有缺漏,研究用文字描述學習實體向量以支援鏈結推斷與檢索。採用預訓練語言模型以鏈結預測目標學習向量表徵,並在未見實體的誘導式鏈結預測、實體分類與實體導向檢索三項任務上驗證泛化能力。結果顯示鏈結預測MRR平均提升22%,分類準確度平均增16%,檢索NDCG@10最高增8.8%。
深度分析
現有醫療大模型多以單回合、完整病歷評估為主,與臨床上從不完備資訊出發、反覆下單檢驗並更新診斷的流程差距甚大。MedAction 提出一套樹狀蒸餾管線,從公開病例生成多回合互動環境,讓大型模型與環境互動以合成檢驗—推理軌跡;
深度分析
研究提出一套以驗證為中心的知識圖譜(KG)與多代理流程,將規格、RTL 與形式工具回饋轉為結構化中介表示,並匯入執行時 KG 作檢索與追溯。系統用 KG 提供設計接地的上下文,驅動 SVA 生成與三種精煉迴圈──語法修復、以反例(CEX)追溯的修正、以及覆蓋率導向的屬性擴增。
深度分析
隨著知識圖譜應用增多,傳統統一衰減已不足以判斷資訊時效。研究提出以觀測頻率與變動幅度為基礎的層級自適應衰減面,分為領域、情境、實體三層學習衰減參數。實驗在合成資料、維基百科與模擬臨床紀錄上驗證,顯示不同知識類型呈現明顯壽命差異,且統一衰減甚至比不使用衰減差 18 倍。
深度分析
系統日誌蘊含豐富威脅情報,但格式零散難以直接利用。OntoLogX結合本體、檢索增強生成與迭代校正,利用大型語言模型將原始日誌轉成本體驅動的知識圖譜,並以會話群組對應MITRE ATT&CK戰術。實驗也顯示檢索與校正能提升精準與召回,程式碼專用模型對結構化日誌特別有利。
速報
知識圖譜常只還原既有關係。本研究以表型驅動流程結合圖神經網路、因果與機率推理,以及大型語言模型生成假設並抽取主張,以多目標優化與Pareto挑選平衡驗證與新穎性。實驗在檢索增強下達成Recall@5=0.98並降低幻覺率,並能揭示情境化因果結構,提升可解釋性與科學檢驗價值。
深度分析
開放式知識圖譜問答因圖譜不完整而受限。GLOW 透過 GNN 預測候選答案,並以結構化提示驅動 LLM 推理,實現符號與語意雙向結合。實驗顯示其在新基準上提升最高 53.3%,顯示開放世界 QA 的可行新方向。
深度分析
企業代碼庫維護難度提升,CCCE 透過雙向知識圖譜遍歷與風險自適應門控自動校準,並以多模型持續學習優化策略,最終縮短平均修復時間並提升追蹤可視性。
深度分析
在網路安全威脅情報分析中,研究比較向量、圖形、代理式與混合四種 RAG 架構。圖形檢索提升結構化事實查詢表現,混合模式在多跳問題上較向量提升最高 35%。結果顯示結合圖形與文字可顯著改善資訊檢索品質。
知識圖譜
本研究針對保險合約等政策文件的缺口與重疊分析提出基準測試,提供十份合約、本體與 58 個情境的 SPARQL 查詢,並比較文字大型語言模型與本體驅動管線的表現,證實顯式本體建模提升一致性與診斷能力,為評估知識圖譜品質提供可重複使用的範本。
AI 產物管理
隨著 AI 模型在各領域的廣泛應用,管理其全生命週期變得愈發複雜。Gypscie 透過知識圖譜與規則查詢語言,提供跨平台的統一產物視圖,並以高階資料流排程模型生命週期活動。實驗結果顯示,該系統能有效優化與排程跨平台資料流,提升 AI 應用開發效率。
深度分析
隨著研究代理人需同時瀏覽網頁與執行計算,現有基準無法全面評估其表現。DRBENCHER 透過四項標準生成跨領域問題,涵蓋實體辨識、屬性擷取與領域計算。實驗顯示最高模型正確率僅 20%,突顯此類任務的挑戰與未來改進空間。