Skip to main content
QUICK REVIEW

[論文レビュー] Racism is a Virus: Anti-Asian Hate and Counterhate in Social Media during the COVID-19 Crisis

Caleb Ziems, Bing He|arXiv (Cornell University)|May 25, 2020
Hate Speech and Cyberbullying Detection参考文献 78被引用数 83
ひとこと要約

本研究では、パンデミック期のTwitterにおけるアジア系差別およびそれに対する反差別発言を、3000万件以上のツイートと8700万以上のノードを含むCOVID-HATEデータセットを用いて分析した。差別は伝染性が高く、ボットが差別を拡散していることが判明し、反差別発言はユーザーが差別的行動をとる可能性を低下させることで、危機時におけるオンライン差別の緩和にデータ駆動型の手法を提供する。

ABSTRACT

The spread of COVID-19 has sparked racism, hate, and xenophobia in social media targeted at Chinese and broader Asian communities. However, little is known about how racial hate spreads during a pandemic and the role of counterhate speech in mitigating the spread. Here we study the evolution and spread of anti-Asian hate speech through the lens of Twitter. We create COVID-HATE, the largest dataset of anti-Asian hate and counterhate spanning three months, containing over 30 million tweets, and a social network with over 87 million nodes. By creating a novel hand-labeled dataset of 2,400 tweets, we train a text classifier to identify hate and counterhate tweets that achieves an average AUROC of 0.852. We identify 891,204 hate and 200,198 counterhate tweets in COVID-HATE. Using this data to conduct longitudinal analysis, we find that while hateful users are less engaged in the COVID-19 discussions prior to their first anti-Asian tweet, they become more vocal and engaged afterwards compared to counterhate users. We find that bots comprise 10.4% of hateful users and are more vocal and hateful compared to non-bot users. Comparing bot accounts, we show that hateful bots are more successful in attracting followers compared to counterhate bots. Analysis of the social network reveals that hateful and counterhate users interact and engage extensively with one another, instead of living in isolated polarized communities. Furthermore, we find that hate is contagious and nodes are highly likely to become hateful after being exposed to hateful content. Importantly, our analysis reveals that counterhate messages can discourage users from turning hateful in the first place. Overall, this work presents a comprehensive overview of anti-Asian hate and counterhate content during a pandemic. The COVID-HATE dataset is available at this http URL.

研究の動機と目的

  • COVID-19パンデミック期におけるソーシャルメディア上でのアジア系差別発言および反差別発言のダイナミクスを理解すること。
  • 差別的および反差別的ユーザーのエンゲージメント、拡散性、ネットワーク行動における違いを調査すること。
  • ボットが差別的および反差別的コンテンツの拡散に果たす役割を検討すること。
  • 反差別発言への暴露が、ユーザーが差別的行動をとる可能性を低下させるかどうかを評価すること。
  • 今後の公衆衛生危機におけるオンライン差別研究を支援するため、大規模かつ手動ラベル付けされたデータセット(COVID-HATE)の作成と公開すること。

提案手法

  • パンデミック期の3か月間にわたり、3000万件以上のツイートと8700万以上のノードを含むCOVID-HATEデータセットを構築した。
  • 差別および反差別検出のためのテキスト分類器を訓練するため、2400件のツイートを手動ラベル付けしたデータセットを作成し、平均AUROCが0.852に達した。
  • 縦断的分析を適用し、ユーザーが最初に差別的ツイートを投稿する前後におけるエンゲージメントと行動の変化を比較した。
  • 差別的および反差別的ユーザーに含まれるボットアカウントを同定・分類し、拡散性およびフォロワー増加の傾向を比較した。
  • 差別的および反差別的ユーザーの社会的ネットワークをマッピングし、相互作用パターンとコンテンツの伝染性を分析した。
  • 手動ラベル付けされたデータを用いた教師あり学習により、テキスト分類モデルを訓練・評価し、大規模な差別および反差別コンテンツの検出を実現した。

実験結果

リサーチクエスチョン

  • RQ1差別的および反差別的ユーザーは、差別的発言を投稿した前後で、エンゲージメントおよび拡散性のパターンにどのような違いを示すか?
  • RQ2ボットは、Twitter上でのアジア系差別および反差別発言の拡散にどの程度寄与しているか?
  • RQ3差別的および反差別的ユーザーは、極端に分断されたコミュニティに閉じているのか、それともイデオロギー的境界を越えて相互作用しているのか?
  • RQ4反差別発言への暴露は、ユーザーが差別的行動をとる可能性を低下させる関連があるか?
  • RQ5差別はオンラインの社会的ネットワークでどの程度伝染性が強く、ネットワーク構造はその広がりにどのような役割を果たすか?

主な発見

  • 差別的ツイートを初めて投稿した後、差別的ユーザーは反差別的ユーザーと比較して、はっきりとエンゲージメントが高まり、発言が活発になった。
  • 差別的ユーザーの10.4%を占めるボットは、非ボットユーザーと比較して、より発言が多く、差別的傾向が強い一方、差別的ボットは反差別的ボットよりも多くのフォロワーを獲得していた。
  • 差別的ユーザーと反差別的ユーザーは頻繁に相互作用しており、両者が孤立した極端なコミュニティに存在しているわけではないことが示された。
  • 差別的コンテンツへの暴露は、ユーザーが差別的行動をとる可能性を高めた。これは、オンラインネットワーク内での差別の伝染性を示している。
  • 反差別メッセージは、ユーザーが差別的行動をとる可能性を低下させるという効果があり、過激化に対する予防的効果があると考えられる。
  • COVID-HATEデータセット内で、891,204件の差別的ツイートと200,198件の反差別ツイートが同定され、今後の研究に貴重なリソースを提供した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。