速報 Query2Effect:用大型語言模型預測因果效果的新基準 隨機對照試驗成本高昂,研究嘗試從既有實驗預測因果效果。Query2Effect 構建超過72000條自然語言查詢,並以兩步法先生成結構化表示再用監督編碼器預測效果。研究比較出廠即用的大型語言模型與微調模型,結果顯示微調能顯著降低誤差並提升領域外泛化能力。