深度分析 SLALOM:以縱向觀測指標驗證 LLM 代理人社會模擬全生命週期 大型語言模型代理人在社會模擬中面臨驗證困境,SLALOM 框架以縱向觀測指標將模擬視為多變量時間序列,設定階段門檻並使用動態時間校正比對實證資料,提升結構真實度量化,為政策模擬可信度提供新基準。
深度分析 大型語言模型在同質性網路中的共識漂移與結構效應分析 本研究探討大型語言模型在模擬社會辯論時的可靠性,利用同質性可控的網路模型觀察多輪互動。實驗發現模型易產生「共識漂移」,即意見向特定方向偏移。結果提醒在將 LLM 作為人類行為代理前,需先分離結構效應與模型偏誤,以免產生誤判。