Skip to main content
QUICK REVIEW

[논문 리뷰] Exploring Climate Change Discourse: Measurements and Analysis of Reddit Data

Smriti Janaswamy, Jeremy R. Blackburn|arXiv (Cornell University)|2024. 12. 01.
Computational and Text Analysis Methods인용 수 1
한 줄 요약

이 연구는 2014년에서 2022년까지 레딧의 기후 변화 논의를 분석하여 11개의 서브레딧에서 데이터를 수집하고, BERTopic을 사용한 토픽 모델링과 명명된 실체 인식(NER)을 적용하여 반복되는 주제, 핵심 실체, 시간적 추세를 규명하였다. 분석 결과, 산불, 재생 가능 에너지, 파리 기후 협정 등 지속적인 주제들이 드러났으며, 유럽과 기후 관련 재난이 주요 지리적 및 사안 기반 참조로 부각되었다.

ABSTRACT

Social media is very popular for facilitating conversations about important topics and bringing forth insights and issues related to these topics. Reddit serves as a platform that fosters social interactions and hosts engaging discussions on a wide array of topics, thus forming narratives around these topics. One such topic is climate change. There are extensive discussions on Reddit about climate change, indicating high interest in its various aspects. In this paper, we explore 11 subreddits that discuss climate change for the duration of 2014 to 2022 and conduct a data-driven analysis of the posts on these subreddits. We present a basic characterization of the data and show the distribution of the posts and authors across our dataset for all years. Additionally, we analyze user engagement metrics like scores for the posts and how they change over time. We also offer insights into the topics of discussion across the subreddits, followed by entities referenced throughout the dataset.

연구 동기 및 목표

  • 2014년에서 2022년까지 레딧에서의 기후 변화 논의의 변화를 이해하기 위해.
  • 기후 관련 서브레딧에서 반복되는 주제, 사용자 참여 패턴, 핵심 실체를 식별하고 특성화하기 위해.
  • 정치적 극화, 기후 사건, 정책 논의가 온라인 논의 형성에 미치는 역할을 분석하기 위해.
  • 레딧가 기후 변화 연구를 위한 데이터 소스로써의 대표성과 한계를 평가하기 위해.

제안 방법

  • 2014년부터 2022년까지 11개의 기후 중심 서브레딧을 수집하고 분석하였으며, 실증적 방법을 통해 시드 목록을 확장하였다.
  • BERTopic, 즉 맥락 기반 토픽 모델링 기법을 적용하여 데이터셋 전반에서 연간 주제를 식별하고 추적하였다.
  • 명명된 실체 인식(NER)을 수행하여 게시물에 언급된 위치, 사안, 법률을 추출하고 분류하였다.
  • 게시물 점수와 게시 빈도와 같은 사용자 참여 지표를 시간 경과에 따라 분석하였다.
  • 연도 간 주제 분포와 실체 언급을 비교하여 지속적인 주제와 새로운 주제를 식별하였다.
  • 대표적인 게시물의 정성적 검토를 통해 주제의 일관성과 맥락적 관련성을 검증하였다.

실험 결과

연구 질문

  • RQ12014년에서 2022년까지 레딧 서브레딧에서 기후 변화 논의 주제는 어떻게 변화해 왔는가?
  • RQ2레딧의 기후 논의에서 가장 자주 언급되는 지리적 지역, 기후 사건, 정책 프레임워크는 무엇인가?
  • RQ3미국의 정당 간 극화와 같은 정치적 역학은 레딧의 기후 변화 논의에 어떻게 반영되는가?
  • RQ4주요 기후 사건(예: 허리케인, 파리 기후 협정)이 온라인 대화 형성에 어떤 역할을 하는가?
  • RQ5게시물 점수와 같은 사용자 참여 지표는 주제의 주목도와 시간적 추세와 어떻게 관련되는가?

주요 결과

  • 파리 기후 협정은 가장 자주 언급된 법령이자 주요 주제였으며, 글로벌 영향과 목표에 관해 다루는 게시물에서는 높은 참여도와 긍정적 정서를 보였다.
  • 유럽이 가장 자주 언급된 지리적 실체로 부상하였고, 그 다음으로 '지구'와 '대서양'이 뒤이었다. 기후 행동, 오염, 산불에 대한 반복적인 언급이 있었다.
  • 상위 15개 실체에는 허리케인 6개(예: 하비, 아이다, 마리아, 도리언), 지구의 날, 세계 환경의 날, 인플레이션 감축법 등이 포함되어 있어 기후 재난과 정책 기념일에 대한 강한 집중을 보였다.
  • 지속적으로 등장한 주제로는 산불, 재생 가능 에너지(예: 태양광 패널), 해수면 상승, 민주당과 공화당 간 기후 정책에 대한 정치적 극화가 있었다.
  • r/climate, r/environment, r/science 등의 서브레딧이 전체 데이터셋의 약 70%를 차지하여 몇몇 큰 커뮤니티에 논의가 집중되어 있음을 시사했다.
  • 명명된 실체 인식을 통해 '대서양' 573건, '태평양' 557건, '북극 해' 368건의 언급을 확인하여 해양 및 극지 기후 변화와 관련된 지역적 우려를 반영하였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.