大型語言模型補洞:LLM 驅動的調查回溯與未問意見預測
全國代表性調查每年問項有限,難以完整捕捉歷史變化。研究以大型語言模型結合題目、受訪者與時期的嵌入向量,進行年份級缺失意見的回溯,並嘗試預測未被詢問的意見。以1972至2021年一般社會調查資料驗證。模型能回復缺失趨勢並定位態度轉折,但對完全未問的預測仍屬有限。
大型語言模型補足調查缺口
大型語言模型被用來回補國家級調查的歷史缺失,能協助還原過去民意走勢並探索未問意見的可能樣態。
研究團隊將題目、受訪者與調查時期轉為嵌入向量,建立 LLM 為基礎的預測框架,用以預測被遮蔽的年份級回答(retrodiction),並嘗試估算從未被詢問的意見。
以1972至2021年一般社會調查為驗證資料,模型在回溯已知民意的交叉驗證與其他組織測量的比對中表現良好,能還原缺失趨勢並找出態度轉折點。研究還能回溯例如同性婚姻等議題的支持度上升時點,幫助追溯何時民意轉變。
然而,對於完全未被詢問的意見,模型預測力仍顯謹慎且表現有限。作者也比較既有基準,檢視哪些議題與受訪者較易被預測,並評估模型是否傾向產生同質化回答。
結論指出:LLM 可拓展調查研究的可能性,但需以實證資料持續校準並監測偏差與風險,才能穩健運用於歷史民意重建與補完。
延伸閱讀
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。