Skip to main content
QUICK REVIEW

[论文解读] Large language models accurately predict public perceptions of support for climate action worldwide

Nattavudh Powdthavee, Sandra J. Geiger|arXiv (Cornell University)|Jan 28, 2026
Climate Change Communication and Perception被引用 0
一句话总结

该研究测试大型语言模型是否能预测全球公众对他人愿意为气候行动出资的认知缺口,将四种模型与盖洛普数据在125个国家进行基准比较。 Claude表现最佳,准确度与传统模型相当。

ABSTRACT

Although most people support climate action, widespread underestimation of others' support stalls individual and systemic changes. In this preregistered experiment, we test whether large language models (LLMs) can reliably predict these perception gaps worldwide. Using country-level indicators and public opinion data from 125 countries, we benchmark four state-of-the-art LLMs against Gallup World Poll 2021/22 data and statistical regressions. LLMs, particularly Claude, accurately capture public perceptions of others' willingness to contribute financially to climate action (MAE approximately 5 p.p.; r = .77), comparable to statistical models, though performance declines in less digitally connected, lower-GDP countries. Controlled tests show that LLMs capture the key psychological process - social projection with a systematic downward bias - and rely on structured reasoning rather than memorized values. Overall, LLMs provide a rapid tool for assessing perception gaps in climate action, serving as an alternative to costly surveys in resource-rich countries and as a complement in underrepresented populations.

研究动机与目标

  • 在全球范围内激发对气候行动支持认知缺口的理解。
  • 评估最先进的LLM在预测人们对他人愿意为气候行动出资的认知方面的能力。
  • 将四种LLM与Gallup World Poll 2021/22及回归模型在125个国家进行基准比较。
  • 识别LLM性能下降的条件(如较低数字连接、GDP)。
  • 解释社会投射的心理过程及其在LLM预测中的表现。

提出的方法

  • 跨125个国家的预注册实验设计。
  • 将四种最先进的LLM与Gallup World Poll数据进行基准比较。
  • 使用平均绝对误差(MAE)和相关系数(r)来评估准确性。
  • 分析LLM是否依赖结构化推理而非记忆化数据。
  • 进行受控测试以通过系统性向下偏差检验社会投射。

实验结果

研究问题

  • RQ1LLMs是否能够在各国可靠预测关于他人愿意为气候行动提供财政支持的认知缺口?
  • RQ2与统计回归模型相比,LLMs在预测这些认知缺口方面的表现如何?
  • RQ3LLM预测是否表现出心理学所描述的社会投射偏差?
  • RQ4在何种国家层面的条件(如GDP、数字连接性)下,LLM表现会下降?
  • RQ5哪些机制(结构化推理与记忆化)驱动LLM的预测?

主要发现

  • Claude在预测感知的为气候行动出资意愿方面最准确(MAE ≈ 5 个百分点;r ≈ .77)。
  • LLMs在预测认知缺口方面的表现与统计回归模型相媲美。
  • 在数字连接性较弱、GDP较低的国家,表现下降。
  • 受控测试表明LLMs在具有系统性向下偏差的情况下捕捉到社会投射。
  • LLMs为评估认知缺口提供了一种快速工具,尤其在资源丰富的环境中。
  • LLMs依赖于结构化推理而非记忆化数值。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。