深度分析 ConsumerSimBench:以多代理評分準則衡量 LLM 的消費者反應模擬能力 ConsumerSimBench 將消費者模擬問題,從主觀分數轉為可審核的逐點是非判斷。研究以 1,553 個中文熱議主題與 23,122 條原子化準則,把群體反應拆成四類:情緒觸發點、情感關鍵字、正面面向與負面面向。