Skip to main content
QUICK REVIEW

[논문 리뷰] Discussing Privacy and Surveillance on Twitter: A Case Study of COVID-19

Jayati Dev|arXiv (Cornell University)|2020. 01. 01.
Misinformation and Its Impacts참고 문헌 5인용 수 1
한 줄 요약

이 연구는 2020년 3월과 4월 기간 동안의 트위터 트윗을 대상으로 LDA 주제 모델링과 NLTK 기반 정서 분석을 사용하여 코로나19 초기 단계 동안의 프라이버시 및 감시에 대한 논의를 분석한다. 연구 결과, 정부 및 기업의 감시에 대한 부정적 정서가 증가하는 것으로 나타났으며, 특히 접촉 추적 앱과 Zoom과 같은 화상 회의 도구와 관련하여 부정적 정서가 시간이 지남에 따라 29%에서 33%로 증가했고, 반대로 긍정적 정서는 37%에서 28%로 감소하였다.

ABSTRACT

Technology is uniquely positioned to help us analyze large amounts of information to provide valuable insight during widespread public health concerns, like the ongoing COVID-19 pandemic. In fact, information technology companies like Apple and Google have recently launched tools for contact tracing-the ability to process location data to determine the people who have been in contact with a possible patient, in order to contain the spread of the virus. While China and Singapore have successfully led the effort, more and more countries are now implementing such surveillance systems, raising potential privacy concerns about this long term surveillance. For example, it is not clear what happens to the information post-pandemic because people are more likely to share their information during a global crisis without governments having to elaborate on their data policies. Digital Ethnography on Twitter, which has over 330 million users worldwide, with a majority in the United States where the pandemic has the worst effects provides a unique opportunity to learn about real-time opinions of the general public about current affairs in a rather naturalistic setting. Consequently, it might be useful to highlight the privacy concerns of users, should they exist, through analysis of Twitter data and information sharing policies during unprecedented public health outbreaks. This will allow governments to protect their citizens both during and after health emergencies.

연구 동기 및 목표

  • 코로나19 패닉 초기 단계 동안 프라이버시 및 감시에 대한 대중의 논의가 어떻게 변화했는지 이해하기 위해.
  • 트위터에서의 감시 및 프라이버시 논의에서 지배적인 주제와 테마를 특정하기 위해.
  • 특히 팬데믹 기간 동안 접촉 추적 및 데이터 수집과 관련된 감시 조치에 대한 대중의 정서를 평가하기 위해.
  • 미디어 보도 및 기술적 사고(예: Zoom 버그)가 대중의 프라이버시 및 감시에 대한 정서에 어떤 영향을 미쳤는지 분석하기 위해.

제안 방법

  • 2020년 3월 1일부터 4월 20일까지 '코로나19'와 '프라이버시' 등의 키워드를 포함한 트윗을 GetOldTweets와 Tweepy API를 사용해 수집하였다.
  • 10개 주제를 가진 잠재적 디리히레트 할당(LDA)을 적용하여 프라이버시 및 감시와 관련된 반복적인 논의 주제를 식별하였다.
  • NLTK의 나이브 베이즈 분류기를 사용하여 정서 분석을 수행하여 트윗을 긍정, 부정, 중립으로 분류하였다.
  • 트윗 수, 재트윗 수, 좋아요 수의 시간적 추이를 추적하여 프라이버시 관련 콘텐츠에 대한 사용자 참여도를 평가하였다.
  • 분석을 위해 토큰화, 불용어 제거, 어간 추출 등의 텍스트 전처리 기법을 적용하였다.
  • 외부 사건(예: 감시 관련 주요 뉴스 기사 및 Zoom 보안 취약성)과 정서 변화를 상관관계 분석하였다.

실험 결과

연구 질문

  • RQ1코로나19 감시와 관련된 다양한 논의 주제는 무엇이며, 빈도는 어떻게 되는가?
  • RQ2팬데믹 초기 몇 달 동안 감시에 대한 대중의 정서는 어떻게 변화했는가?
  • RQ3미디어 보도와 기술적 사고는 프라이버시 및 감시에 대한 대중의 정서에 어떤 역할을 하는가?

주요 결과

  • 감시에 대한 부정적 정서는 3월의 29%에서 4월의 33%로 증가하여 공공의 우려가 증가하고 있음을 시사한다.
  • 감시에 대한 긍정적 정서는 3월의 37%에서 4월의 28%로 감소하였으며, 특히 '매우 긍정적' 정서가 크게 감소하였다.
  • 중립 정서는 3월의 34%에서 4월의 38%로 유지되어 대부분의 트윗이 의견이 아닌 사실 정보를 공유하고 있음을 나타낸다.
  • 가장 높은 참여도를 보인 트윗은 감시가 널리 퍼져 있다는 사실을 담은 기사 링크였으며, 감정적으로 강한 포스트는 아니었다.
  • 주제 모델링 결과, 논의의 중심은 주로 정부 감시, 데이터 보호, 접촉 추적 앱 및 화상 회의 도구와 관련된 프라이버시 우려였다.
  • 2020년 3월 23일 트윗 수가 급증했는데, 이는 뉴욕타임스의 감시에 관한 전망 기사가 게재된 것과 일치하여 미디어의 영향이 대중 논의에 영향을 미쳤음을 시사한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.