Skip to main content
QUICK REVIEW

[論文レビュー] Discussing Privacy and Surveillance on Twitter: A Case Study of COVID-19

Jayati Dev|arXiv (Cornell University)|Jan 1, 2020
Misinformation and Its Impacts参考文献 5被引用数 1
ひとこと要約

本研究では、2020年3月から4月にかけての初期コロナウイルスパンデミック期における、Twitter上のプライバシーと監視に関する議論を、LDAトピックモデリングとNLTKベースのセンチメント分析を用いて分析した。政府および企業の監視に対する否定的センチメントが上昇しており、特に接触追跡アプリやZoomなどのビデオ会議ツールに関連して顕著である。否定的センチメントは時間経過とともに29%から33%に上昇し、肯定的センチメントは37%から28%に減少した。

ABSTRACT

Technology is uniquely positioned to help us analyze large amounts of information to provide valuable insight during widespread public health concerns, like the ongoing COVID-19 pandemic. In fact, information technology companies like Apple and Google have recently launched tools for contact tracing-the ability to process location data to determine the people who have been in contact with a possible patient, in order to contain the spread of the virus. While China and Singapore have successfully led the effort, more and more countries are now implementing such surveillance systems, raising potential privacy concerns about this long term surveillance. For example, it is not clear what happens to the information post-pandemic because people are more likely to share their information during a global crisis without governments having to elaborate on their data policies. Digital Ethnography on Twitter, which has over 330 million users worldwide, with a majority in the United States where the pandemic has the worst effects provides a unique opportunity to learn about real-time opinions of the general public about current affairs in a rather naturalistic setting. Consequently, it might be useful to highlight the privacy concerns of users, should they exist, through analysis of Twitter data and information sharing policies during unprecedented public health outbreaks. This will allow governments to protect their citizens both during and after health emergencies.

研究の動機と目的

  • 初期コロナウイルスパンデミック期における、プライバシーと監視に関する公共的議論がどのように変化したかを理解すること。
  • Twitter上での監視とプライバシーに関する議論における主要なテーマやトピックを特定すること。
  • パンデミック期における接触追跡やデータ収集に関連する監視措置に対する公共のセンチメントを評価すること。
  • マスコミ報道や技術的トラブル(例:Zoomのバグ)が、プライバシーと監視に関する公共のセンチメントに与える影響を検討すること。

提案手法

  • 2020年3月1日から4月20日までに、'coronavirus' や 'privacy' などのキーワードを含むツイートを収集する目的で、GetOldTweetsおよびTweepy APIを用いてTwitterデータを収集した。
  • プライバシーと監視に関する繰り返し発生する議論のテーマを特定するため、10つのトピックを用いて潜在的ディリクレ割り当て(LDA)を適用した。
  • ツイートを肯定的、否定的、中立的の3つに分類するため、NLTKのナイーブベイズ分類器を用いてセンチメント分析を実施した。
  • プライバシー関連コンテンツに対するユーザー参加度を評価するため、ツイート数、リツイート数、お気に入り数の時間的推移を追跡した。
  • 分析に備えて、トークン化、ストップワードの除去、ステミングを含むテキスト前処理技術を用いた。
  • 外部イベント(例:監視に関する主要メディア報道、Zoomのセキュリティ脆弱性)とセンチメントの変化を相関させた。

実験結果

リサーチクエスチョン

  • RQ1COVID-19監視に関連する議論のトピックは何か。また、それらはどれくらいの頻度で発生しているか。
  • RQ2パンデミック初期の数か月間にわたり、公共の監視に対するセンチメントはどのように変化したか。
  • RQ3マスコミ報道や技術的トラブルが、プライバシーと監視に関する公共のセンチメントに果たす役割は何か。

主な発見

  • 監視に対する否定的センチメントは、3月の29%から4月の33%に上昇し、公的な懸念が高まっていることを示している。
  • 監視に対する肯定的センチメントは、3月の37%から4月の28%に減少し、特に「非常に肯定的」なセンチメントの低下が顕著であった。
  • 中立的センチメントは、3月に34%、4月に38%を維持しており、大多数のツイートが意見ではなく事実情報であることを示している。
  • 最もエンゲージメントの高かったツイートは、広範な監視に関する事実情報のリンクであり、感情的な内容の投稿ではなかった。
  • トピックモデリングの結果、議論は主に政府の監視、データ保護、接触追跡アプリやビデオ会議ツールに関連するプライバシー懸念に集中していることが明らかになった。
  • 3月23日にツイート数が急増したのは、ニューヨーク・タイムズが監視についての専門家の意見記事を発表したことに一致しており、マスコミ報道が公共的議論に与える影響を示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。