[論文レビュー] Large language models accurately predict public perceptions of support for climate action worldwide
研究はLLMが他者の気候変動 action への財政支援意欲を巡る世界的な認識ギャップを予測できるかを検証し、125カ国でGallupデータと4つのLLMを比較。Claudeが最も優れており、従来モデルと同程度の精度。
Although most people support climate action, widespread underestimation of others' support stalls individual and systemic changes. In this preregistered experiment, we test whether large language models (LLMs) can reliably predict these perception gaps worldwide. Using country-level indicators and public opinion data from 125 countries, we benchmark four state-of-the-art LLMs against Gallup World Poll 2021/22 data and statistical regressions. LLMs, particularly Claude, accurately capture public perceptions of others' willingness to contribute financially to climate action (MAE approximately 5 p.p.; r = .77), comparable to statistical models, though performance declines in less digitally connected, lower-GDP countries. Controlled tests show that LLMs capture the key psychological process - social projection with a systematic downward bias - and rely on structured reasoning rather than memorized values. Overall, LLMs provide a rapid tool for assessing perception gaps in climate action, serving as an alternative to costly surveys in resource-rich countries and as a complement in underrepresented populations.
研究の動機と目的
- 世界中で気候変動対策への支援に関する認識ギャップを理解する動機づけ。
- 最先端のLLMが他者の財政的な気候対策支援意欲を人々がどのように認識しているかを予測できるかを評価。
- Gallup World Poll 2021/22と回帰モデルを125カ国でLLMと比較。
- LLMの性能が低下する条件を特定(例:デジタル接続性が低い、GDPが低い)。
- 社会的投影の心理的過程とそれがLLMの予測にどう現れるかを説明。)
提案手法
- 125カ国を横断する事前登録実験デザイン。
- Gallup World Pollデータと4つの最先端LLMをベンチマーク。
- 平均絶対誤差(MAE)と相関(r)で精度を評価。
- LLMsが構造的推論に基づくのか、記憶データに依存しているのかを分析。
- 体系的な下方バイアスを用いた社会的投影を検証する管理実験を実施。
実験結果
リサーチクエスチョン
- RQ1LLMsは国を跨いだ他者の財政支援意欲に関する公的認識ギャップを信頼性をもって予測できるか。
- RQ2LLMsはこれらの認識ギャップを予測する際、統計的回帰モデルと比較してどうか。
- RQ3LLMの予測に心理学における社会的投影バイアスが現れるか。
- RQ4国レベルの条件(例:GDP、デジタル接続性)がLLMの性能をどのように悪化させるか。
- RQ5構造化推論 vs. 記憶化のいずれがLLMの予測を支えるか。
主な発見
- Claudeが財政的な気候変動対策支援に対する認識意欲を最も正確に予測(MAE ≈ 5 percentage points; r ≈ .77)。
- LLMsは認識ギャップ予測において統計的回帰モデルと同程度の性能。
- デジタル接続性が低くGDPが低い国で性能が低下。
- 管理された検証ではLLMsが社会的投影を体系的な下方バイアスとして捉えている。
- LLMsは特に資源豊富な文脈で認識ギャップを迅速に評価するツールを提供。
- LLMsは記憶された値よりも構造化推論に依存する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。