深度分析 REL 基準揭示大型語言模型在高階關係推理的瓶頸 本研究聚焦大型語言模型的關係推理,提出以關係複雜度衡量的 REL 基準,涵蓋代數、化學與生物領域。實驗顯示,隨著需要同時綁定的實體數增多,模型表現呈單調下降,即使提升測試計算資源亦未改善,突顯高階關係綁定的瓶頸。