[論文レビュー] Global Sentiment Analysis Of COVID-19 Tweets Over Time
本論文は、VADERラベリングとML分類器(LSTMとANN)を用いて、2020年1月から2020年6月までのグローバルなCOVID-19ツイートの感情を分析し、在宅勤務(WFH)とオンライン学習の感情をケースデータとともに検討する。
The Coronavirus pandemic has affected the normal course of life. People around the world have taken to social media to express their opinions and general emotions regarding this phenomenon that has taken over the world by storm. The social networking site, Twitter showed an unprecedented increase in tweets related to the novel Coronavirus in a very short span of time. This paper presents the global sentiment analysis of tweets related to Coronavirus and how the sentiment of people in different countries has changed over time. Furthermore, to determine the impact of Coronavirus on daily aspects of life, tweets related to Work From Home (WFH) and Online Learning were scraped and the change in sentiment over time was observed. In addition, various Machine Learning models such as Long Short Term Memory (LSTM) and Artificial Neural Networks (ANN) were implemented for sentiment classification and their accuracies were determined. Exploratory data analysis was also performed for a dataset providing information about the number of confirmed cases on a per-day basis in a few of the worst-hit countries to provide a comparison between the change in sentiment with the change in cases since the start of this pandemic till June 2020.
研究の動機と目的
- 2020年1月から2020年6月までのTwitterデータを用いて、COVID-19に対するグローバルな公衆の感情を評価する。
- ロックダウン期間中の在宅勤務(Work From Home)とオンライン学習の感情動向を評価する。
- 選定された最悪影響を受けた国々における日別COVID-19症例動向と感情ダイナミクスを比較する。
- ツイート感情分類のための機械学習モデル(LSTMとANN)を開発・比較する。
提案手法
- 2020年1月から2020年6月までに、コロナウイルス関連、オンライン学習、在宅勤務の3つのツイートデータセットを作成する。
- VADERを用いて感情をラベル付けし、2値感情分析(肯定/否定)と感情検出(fear, trust)をNRC EmoLexで行う。
- ラベル付けされたデータを用いて感情分類のためのLSTMとANN分類器を訓練・評価し、精度を報告する。
- 探索的データ分析を行い、世界規模および最悪被害国の感情および感情動向を可視化する。
- Kaggleデータセットの日次COVID-19症例データと感情/感情動向を関連付ける。
実験結果
リサーチクエスチョン
- RQ12020年1月から2020年6月までのCOVID-19に対するグローバルおよび国別の感情動向はどのようなものか。
- RQ2 lockdown期間中の在宅勤務(Work From Home)とオンライン学習に対する感情はどのように変化するか。
- RQ3恐怖と信頼の感情は時間と国によってどのように変動し、症例動向とどのように関連するか。
- RQ4COVID-19関連ツイートの感情分類において、LSTMとANNは精度の面でどのように比較されるか。
主な発見
- LSTMはコロナウイルス関連ツイートで84.5%の精度を達成した。ANNは76%の精度を達成した。
- 肯定的感情と否定的感情の差は2月から3月に最大で、後の月には縮小した。
- 恐怖が感情スコアを支配し、信頼も見られた。国によって感情プロファイルは異なり(例: 一部の国でより高い信頼)。
- WFHの感情は全体的に肯定的が否定的よりも多かった。オンライン学習は概ねポジティブだったが、顕著な否定的要素も見られた。
- 3月以降は症例の急増を示し、感情/感情パターンはロックダウン政策と症例動態を反映していた。
- 3つのデータセット(coronavirus、WFH、Online Learning)は、世界規模の症例データに対する比較可視化を可能にした。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。