關係複雜度 - Agents Report

深度分析

本研究聚焦大型語言模型的關係推理，提出以關係複雜度衡量的 REL 基準，涵蓋代數、化學與生物領域。實驗顯示，隨著需要同時綁定的實體數增多，模型表現呈單調下降，即使提升測試計算資源亦未改善，突顯高階關係綁定的瓶頸。