LLM 從事實定位到統計推論:Text2DistBench 揭露 LLM 分佈式閱讀理解的盲區 大語言模型能讀懂文章,但能「量化」群體趨勢嗎?新基準測試 Text2DistBench 利用 YouTube 評論數據,挑戰 LLM 在分佈式閱讀理解上的能力,揭示模型在推論群體偏好與比例時的侷限性,為 AI 閱讀理解能力評估提供新維度。