[論文レビュー] Twitter discussions and emotions about COVID-19 pandemic: a machine learning approach
本研究では、2020年3月1日から4月21日までの400万件のTwitter投稿を対象とし、Latent Dirichlet Allocation (LDA)およびセンチメント分析を用いて、COVID-19に関する公的議論における主要なトピック、テーマ、感情を同定した。その結果、新規症例や死亡者数の話題では恐怖が支配的であるのに対し、パンデミック全体の議論では期待、信頼、怒り、恐怖が特徴的であることが明らかになった。これは、Twitterがリアルタイムでの公衆衛生監視に有効であることを示している。
The objective of the study is to examine coronavirus disease (COVID-19) related discussions, concerns, and sentiments that emerged from tweets posted by Twitter users. We analyze 4 million Twitter messages related to the COVID-19 pandemic using a list of 25 hashtags such as "coronavirus," "COVID-19," "quarantine" from March 1 to April 21 in 2020. We use a machine learning approach, Latent Dirichlet Allocation (LDA), to identify popular unigram, bigrams, salient topics and themes, and sentiments in the collected Tweets. Popular unigrams include "virus," "lockdown," and "quarantine." Popular bigrams include "COVID-19," "stay home," "corona virus," "social distancing," and "new cases." We identify 13 discussion topics and categorize them into five different themes, such as "public health measures to slow the spread of COVID-19," "social stigma associated with COVID-19," "coronavirus news cases and deaths," "COVID-19 in the United States," and "coronavirus cases in the rest of the world". Across all identified topics, the dominant sentiments for the spread of coronavirus are anticipation that measures that can be taken, followed by a mixed feeling of trust, anger, and fear for different topics. The public reveals a significant feeling of fear when they discuss the coronavirus new cases and deaths than other topics. The study shows that Twitter data and machine learning approaches can be leveraged for infodemiology study by studying the evolving public discussions and sentiments during the COVID-19. Real-time monitoring and assessment of the Twitter discussion and concerns can be promising for public health emergency responses and planning. Already emerged pandemic fear, stigma, and mental health concerns may continue to influence public trust when there occurs a second wave of COVID-19 or a new surge of the imminent pandemic.
研究の動機と目的
- SNSを通じたCOVID-19パンデミックに関する公的議論、懸念、感情を検討すること。
- 初期パンデミック段階におけるTwitterにおける顕著なトピックとテーマを同定すること。
- さまざまな議論トピックにおける、恐怖、怒り、期待、信頼といった支配的 emotions を評価すること。
- Twitterデータと機械学習の、インフォデミオロジーおよび公衆衛生緊急対応における可能性を評価すること。
提案手法
- 2020年3月1日から4月21日までの間、COVID-19関連の25のハッシュタグを用いて400万件のツイートを収集した。
- Latent Dirichlet Allocation (LDA)を適用し、13の明確に区別される議論トピックを同定し、5つの包括的なテーマに分類した。
- ツイートコーパスから一般的なユニグラム(例:'virus'、'lockdown')およびビグラム(例:'stay home'、'social distancing')を同定した。
- センチメント分析を実施し、トピックごとの支配的 emotions(期待、恐怖、怒り、信頼)を分類した。
- テーマを、公衆衛生対策、社会的ステイグマ、症例/死亡者数の報告、米国特有の議論、および世界的な症例の5つに分類した。
- 機械学習を用いて、公衆衛生応用のためのリアルタイムでの公的感情と懸念の変化をマッピングした。
実験結果
リサーチクエスチョン
- RQ1初期パンデミック期における、TwitterにおけるCOVID-19に関する公的議論で最も頻繁に取り上げられるトピックとテーマは何か?
- RQ2恐怖、怒り、期待、信頼といった感情が、さまざまな議論トピックにおいてどのように変動するか?
- RQ3新規症例や死亡者数の話題を扱う際、どのような感情反応が支配的になるか?他のパンデミック関連トピックと比較して。
- RQ4Twitterデータに適用された機械学習モデルが、リアルタイムでの公衆衛生監視および緊急計画にどの程度貢献できるか?
主な発見
- 一般的なユニグラムとして 'virus'、'lockdown'、'quarantine' が最も多く使われており、代表的なビグラムには 'COVID-19'、'stay home'、'social distancing' が含まれる。
- 13の明確に区別される議論トピックが同定され、公衆衛生対策や社会的ステイグマを含む5つのテーマにグループ化された。
- 新規症例や死亡者数の話題では、恐怖が他の感情を上回るほど支配的となった。
- すべてのトピックにおいて、保護策への期待が最も一般的な感情であり、その後に信頼、怒り、恐怖の複雑な感情が続く。
- 本研究では、Twitterデータと機械学習が、公衆衛生緊急事態における変化する公的感情と懸念を効果的に追跡できることを示している。
- 持続的なパンデミック関連の恐怖、ステイグマ、およびメンタルヘルスの懸念は、今後の流行や第二波の際の公的信頼を損なう可能性がある。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。