Skip to main content
QUICK REVIEW

[論文レビュー] The Ivory Tower Lost: How College Students Respond Differently than the General Public to the COVID-19 Pandemic

Viet Duong, Phu Pham|arXiv (Cornell University)|Apr 21, 2020
Sentiment Analysis and Opinion Mining参考文献 36被引用数 38
ひとこと要約

本論文は、US大学の12,776人のTwitterフォロワーからの73,787件のCOVID-19関連ツイートを分析し、人口統計推定、話題モデル、そして transformer ベースの感情分析を用いて、大学生と一般公衆を比較した。結果、大学生はよりネガティブな感情を示し、学校関連の問題に焦点を当てやすい。

ABSTRACT

Recently, the pandemic of the novel Coronavirus Disease-2019 (COVID-19) has presented governments with ultimate challenges. In the United States, the country with the highest confirmed COVID-19 infection cases, a nationwide social distancing protocol has been implemented by the President. For the first time in a hundred years since the 1918 flu pandemic, the US population is mandated to stay in their households and avoid public contact. As a result, the majority of public venues and services have ceased their operations. Following the closure of the University of Washington on March 7th, more than a thousand colleges and universities in the United States have cancelled in-person classes and campus activities, impacting millions of students. This paper aims to discover the social implications of this unprecedented disruption in our interactive society regarding both the general public and higher education populations by mining people's opinions on social media. We discover several topics embedded in a large number of COVID-19 tweets that represent the most central issues related to the pandemic, which are of great concerns for both college students and the general public. Moreover, we find significant differences between these two groups of Twitter users with respect to the sentiments they expressed towards the COVID-19 issues. To our best knowledge, this is the first social media-based study which focuses on the college student community's demographics and responses to prevalent social issues during a major crisis.

研究の動機と目的

  • 大学生と一般公衆がTwitter上のCOVID-19に関する議論でどのように異なるかを測定する。
  • パンデミック期間中に各グループが提起する中心的な話題と課題を特定する。
  • Twitterデータから大学生の人口統計を推定するモデルを開発する。
  • 話題ベースのサブセットに感情分析を適用し、感情的反応を理解する。

提案手法

  • US News上位200大学のフォロワー(100,000人をサンプリング)および2020年1月20日–3月20日の間の1,873,022ツイートからTwitterデータを収集する。
  • キーワードリストを用いてCOVID-19関連ツイートを識別し、12,776ユーザーから73,787件のユニークなツイートを抽出する。
  • 感情認識を考慮したトークン化、スペル訂正、正規化、ハッシュタグのセグメンテーション、品詞/lemmaアノテーションを用いてテキストを前処理する。
  • プロフィール情報(名前、スクリーンネーム、自己紹介、プロフィール画像)を用いてM3深層学習システムで年齢、性別、所属を推定する。
  • 人間の判断による金標準サブセット(2,400人のユーザー)を大学生ステータスに注釈付けし;Bag-of-N-grams (TF-IDF) でRandom Forestを訓練し、PMIベースの属性ヒューリスティクス(“my-X”ルール)を適用して同定精度を高める。
  • lemmatized tokenとbigram/trigramを用いてLDA(55トピック; コヒアレンス0.373)で話題モデリングを実行し、t-SNEで可視化する。
  • SemEval-2017 Task 4Aデータを用いてRoBERTaおよびBERTのベースラインで感情評価を行い;RoBERTaは二値・三値感情タスクでMacro-F1 ≈ 0.806を達成する。

実験結果

リサーチクエスチョン

  • RQ1大学生と一般公衆がTwitter上で議論するCOVID-19関連の支配的な話題は何か。
  • RQ2これらの話題に関して、COVID-19問題に対する感情は大学生と一般公衆でどう異なるか。
  • RQ3Twitterのプロフィールと内容から大学生の人口統計をどれくらい正確に推定できるか、そしてそれが比較分析にどう役立つか。
  • RQ4危機時にこれらの人口統計と感情の差異が教育者や政策立案者にもたらす影響は何か。

主な発見

  • 大学生と一般公衆はCOVID-19の話題を異なる形で議論しており、学生は学校の閉鎖や地域の生活環境により焦点を当てる。
  • 全体としてネガティブな感情がより多く見られ、大学生は中心的なCOVID-19問題に対して有意によりネガティブな感情を示す。
  • 社会的距離推進と学校閉鎖に関連する話題は、学生と一般公衆の間で最大のネガティブ差を示す(それぞれネガティブツイートが約14.5%、13.8%)。
  • 学生は遠隔学習と学業への影響に強いネガティブ反応を示す(例:遠隔学習サブトピックで81.3%がネガティブ)。
  • 中国起源論争に関する人種差別関連の議論が顕著で、差別に対するネガティブ性が高い;パンデミック中に人種差別の対象が東アジア系コミュニティへと移動した点を指摘している。
  • 大学生の人口統計推定は頑健な性能を達成(Bag-of-N-gramsのRandom Forestで約78%精度、my-Xヒューリスティクスで約83%へ改善);識別された学生の性別分布は約53.8%が女性、年齢分布はおおよそ19–29歳(≈54.1%)。
  • RoBERTaベースの感情分類はSemEval-2017データでベースラインを上回りMacro-F1 ≈ 0.806を達成し、COVID-19ツイートコーパスに対する信頼性の高い話題特異的感情分析を裏付ける。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。