深度分析 LLM在經濟因果推論的方向性偏誤:EconCausal基準的實證評估 研究檢視大型語言模型是否在經濟因果推論中呈現系統性意識形態偏誤。研究團隊以EconCausal擴充出一千零五十六個立場爭議案例,並在一萬零四百九十個因果三元組上測試二十款模型。以語境為基礎的符號預測任務,模型需判斷處遇與結果間的正負或無效關係。發現模型在與介入導向一致時表現較佳,錯誤偏向介入預測。