『Vox Populi, Vox AI? Using Language Models to Estimate German Public Opinion』を生成AIと読む
インフォグラフィックでのまとめ

論文に書いてあること
研究概要
- LLM(GPT-3.5)を使用してドイツの世論予測を試みた
- 2017年のドイツ選挙データを基に架空の投票者サンプルを生成
- 特定の政党(緑の党や左派党)への偏りがあり、全体的な予測精度は低かった
研究の新規性
- アメリカ以外の国(ドイツ)でLLMを用いた世論予測を検証
- 多党制の国におけるLLMの予測能力を詳細に分析
研究手法
- ドイツ長期選挙研究(GLES)のデータを基に個々の投票者の特徴を持つペルソナを作成
- 各ペルソナの投票先をGPT-3.5に予測させる
検証方法
- GPT-3.5の予測結果を実際のGLESデータと比較
- 特定の人口統計グループや政党支持者に対する予測の正確性を検証
結果と議論
- LLMの予測には偏りがあり、特定の政党に対する過大評価や過小評価が見られた
- 複雑な多党制における投票行動の多様な要因を十分に捉えられない
- LLMのトレーニングデータの偏りや限界が影響していると考えられる
論文の感想(論文に書いてないこと)
LLMの偏りの原因
投票行動の複雑性
- 実際の人間は合理的に倫理的に投票するとは限らない
- 感情的な要因など複雑な要素が影響している
研究設計の改善案
データの代表性向上
- 複数のデータソースとの比較
- サンプルのリウェイト技術の使用
分析手法の拡張
- 感情分析の導入
- クロスバリデーションの実施
- 時系列分析の導入
- 多変量統計分析の活用
今後の研究への提案
- 最新のLLM(GPT-4oやClaude 3.5 Sonnet)を用いた研究プロトコルの更新
- オープンサイエンスの促進
- 継続的なモデル改善
課題
- 投票サンプルの妥当性評価の必要性
- LLMの進歩だけでは解決できない社会科学研究の本質的な課題
編集後記
生成AIの能力とは別に、社会科学のモデルなどが難しいことを垣間見ました。