表型驅動的知識圖譜發現:結合圖神經網路、因果推論與大型語言模型
知識圖譜常只還原既有關係。本研究以表型驅動流程結合圖神經網路、因果與機率推理,以及大型語言模型生成假設並抽取主張,以多目標優化與Pareto挑選平衡驗證與新穎性。實驗在檢索增強下達成Recall@5=0.98並降低幻覺率,並能揭示情境化因果結構,提升可解釋性與科學檢驗價值。
表型驅動的知識圖譜擴展
現有知識圖譜建構多為確認性工作,偏重還原既有連結而非發掘情境依賴或新穎節點。論文提出以表型驅動、證據治理為核心的統一管線,改變既有範式,從假設發現到受控擴充皆受證據約束。
方法面整合圖神經網路進行表型發現,並以因果推論與機率推理驗證結構性支持;大型語言模型負責生成假設與抽取主張,候選主張以多目標優化同時評估相關性、結構驗證與新穎性。透過Pareto最適挑選非劣解,避免納入瑣碎或冗贅的知識。
實驗在異質族群資料上顯示,該框架能產出更可解釋的表型、揭示情境化的因果結構;在檢索增強設定下,系統Recall@5達到0.98且幻覺率降至0.05,相較於規則式或僅用LLM的基線,在可驗證性與新穎性間取得更佳平衡。
延伸閱讀
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。