Skip to main content
QUICK REVIEW

[논문 리뷰] Disinformation and Misinformation on Twitter during the Novel Coronavirus Outbreak

Binxuan Huang, Kathleen M. Carley|arXiv (Cornell University)|2020. 06. 07.
Misinformation and Its Impacts참고 문헌 3인용 수 52
한 줄 요약

본 연구는 67.4 million COVID-19 관련 트윗을 12 million users(Jan 29–Mar 4, 2020)에서 분석하여 누가 disinformation을 확산시키는지, 무엇이 논의되는지, 그리고 그것이 국가 간에 어떻게 흐르는지 특징지킨다.

ABSTRACT

As the novel coronavirus spread globally, a growing public panic was expressed over the internet. We examine the public discussion concerning COVID-19 on Twitter. We use a dataset of 67 million tweets from 12 million users collected between January 29, 2020 and March 4, 2020. We categorize users based on their home countries, social identities, and political orientation. We find that news media, government officials, and individual news reporters posted a majority of influential tweets, while the most influential ones are still written by regular users. Tweets mentioning "fake news" URLs and disinformation story-lines are also more likely to be spread by regular users. Unlike real news and normal tweets, tweets containing URLs pointing to "fake news" sites are most likely to be retweeted within the source country and so are less likely to spread internationally.

연구 동기 및 목표

  • COVID-19에 대한 트위터 논의에서 어떤 사용자 유형이 가장 영향력 있는지(거주국, 사회적 정체성, 정치적 성향별) 이해한다.
  • 초기 팬데믹 기간 동안 disinformation 이야기와 가짜 뉴스 URL을 누가 논의하는지 식별한다.
  • 저신뢰 정보에 대한 논의를 포함하는 지리적 분포와 국제적 확산을 평가한다.
  • 국가 간에 확산되는 disinformation과 misinformation의 글로벌 네트워크를 특징화한다.

제안 방법

  • COVID-19 관련 키워드를 사용하여 67.4 million 트윗 데이터세트를 수집하고 필터링한다(Jan 29–Mar 4, 2020).
  • 정확도가 높은 위치 추정 모델로 사용자 거주국을 예측한다(국가 92.96%, 신원 95.4%, 정치 성향 87.4%).
  • 7가지 정체성(뉴스 매체, 뉴스 기자, 유명인, 정부 관계자, 스포츠, 기업, 일반 사용자)으로 사용자 유형을 분류한다.
  • 블랙, 레드, 오렌지 계열의 가짜 뉴스 사이트 목록과 실제 뉴스 사이트를 선별하고 다섯 가지 허위정보 이야기선(생물 무기, 마늘, 참깨유, 표백제, 차 chlorine dioxide)을 매핑한다.
  • 가짜 뉴스 URL 및 잘못된 정보 언급을 포함하는 트윗을 분석하여 누가 이를 트윗하는지와 봇 유사 행동을 평가한다(봇 탐지 방법 60% 컷오프 사용).
  • 지리적 분포와 국경 간 리트윗 흐름을 지오태그와 국가 수준 위치 예측으로 검토하고, 분포 간 KL 발산(다양성)과 엔트로피를 측정한다.

실험 결과

연구 질문

  • RQ1세계적 보건 비상 상황 동안 영향력 있는(다시 인용된 비율이 높은) 트윗을 보내는 사용자 유형은 무엇인가?
  • RQ2누가 disinformation 이야기와 가짜 뉴스 URL을 논의하며 그 특성은 무엇인가?
  • RQ3저신뢰 정보에 대해 논의하는 사용자는 전 세계 어디에서 왔으며 이 분포는 어떻게 형성되는가?
  • RQ4국가 간 정보 흐름에 대한 글로벌 네트워크는 무엇인가?

주요 결과

  • 일반 사용자(봇 유사 사용자 포함)가 영향력 있는 트윗의 다수를 생성하며, 뉴스 기관과 정부 관계자가 상당한 비중으로 기여하지만 다수는 아님.
  • 가짜 뉴스 URL 및 잘못된 정보 언급을 포함하는 트윗의 약 90%가 일반 사용자가 시작하며, 신뢰도가 낮은 사이트가 더 많은 봇 유사 활동을 유도한다.
  • 블랙/레드/오렌지 가짜 뉴스 사이트로 연결되는 사용자는 특히 블랙 사이트의 경우 봇이 비율이 높다(예: 58.74% 봇 중 정규 사용자가 블랙 URL을 인용).
  • 생물 무기 음모론은 가장 널리 확산되는 이야기선이며, 표백제 및 차 염소 디옥사이드 주장도 두드러지며, 많은 표백제 트윗은 풍자적이다.
  • 가짜 뉴스 URL 및 잘못된 정보에 대한 논의는 미국 중심적이며, 정규화된 확률이 더 높고 영어권 인구에서의 KL 발산이 실제 뉴스 논의보다 크다.
  • 허위정보 주제는 대체로 국가 내에 머무르는 경향이 있으며, 실제 뉴스 논의는 국제적 확산이 더 큰 반면 WHO 및 글로벌 보건 당국이 허위정보에 대응하는 데 도움을 주었다.
  • 지리적 분포와 엔트로피 분석은 잘못된 정보 논의의 국가 다양성이 실제 뉴스 논의보다 낮고 흐름이 미국에서 다른 국가로 집중되어 있음을 보인다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.