[논문 리뷰] Racism is a Virus: Anti-Asian Hate and Counterhate in Social Media during the COVID-19 Crisis
이 연구는 코로나19 패an드레미크 기간 동안 트위터에서의 반아시안 혐오 및 반혐오 발언을 분석하며, 3,000만 건 이상의 트윗과 8700만 개 이상의 노드를 포함하는 COVID-HATE 데이터셋을 활용한다. 연구 결과 혐오가 전염성 있으며 봇이 혐오를 확산시킨다는 점을 규명했고, 반혐오 발언이 사용자가 혐오로 전환하는 것을 효과적으로 줄이는 것으로 나타나, 위기 상황에서 온라인 인종차별을 완화하기 위한 데이터 기반 접근법을 제공한다.
The spread of COVID-19 has sparked racism, hate, and xenophobia in social media targeted at Chinese and broader Asian communities. However, little is known about how racial hate spreads during a pandemic and the role of counterhate speech in mitigating the spread. Here we study the evolution and spread of anti-Asian hate speech through the lens of Twitter. We create COVID-HATE, the largest dataset of anti-Asian hate and counterhate spanning three months, containing over 30 million tweets, and a social network with over 87 million nodes. By creating a novel hand-labeled dataset of 2,400 tweets, we train a text classifier to identify hate and counterhate tweets that achieves an average AUROC of 0.852. We identify 891,204 hate and 200,198 counterhate tweets in COVID-HATE. Using this data to conduct longitudinal analysis, we find that while hateful users are less engaged in the COVID-19 discussions prior to their first anti-Asian tweet, they become more vocal and engaged afterwards compared to counterhate users. We find that bots comprise 10.4% of hateful users and are more vocal and hateful compared to non-bot users. Comparing bot accounts, we show that hateful bots are more successful in attracting followers compared to counterhate bots. Analysis of the social network reveals that hateful and counterhate users interact and engage extensively with one another, instead of living in isolated polarized communities. Furthermore, we find that hate is contagious and nodes are highly likely to become hateful after being exposed to hateful content. Importantly, our analysis reveals that counterhate messages can discourage users from turning hateful in the first place. Overall, this work presents a comprehensive overview of anti-Asian hate and counterhate content during a pandemic. The COVID-HATE dataset is available at this http URL.
연구 동기 및 목표
- 코로나19 패an드레미크 기간 동안 소셜 미디어에서의 반아시안 혐오 발언과 반혐오 발언의 역학을 이해하기 위해.
- 혐오 발언자와 반혐오 발언자 간의 참여도, 바이럴성, 네트워크 행동에서의 차이를 조사하기 위해.
- 봇이 혐오 및 반혐오 콘텐츠 확산에 어떤 역할을 하는지 분석하기 위해.
- 반혐오 발언에 노출된 것이 사용자가 혐오 행동을 취할 가능성을 줄이는지 평가하기 위해.
- 미래의 공중보건 위기 동안 온라인 혐오 연구를 위해 사용할 수 있는 대규모 수작업 레이블링 데이터셋(COVID-HATE)을 제작하고 공개하기 위해.
제안 방법
- 코로나19 패an드레미크 기간 동안 세 달간의 트위터 데이터를 바탕으로 3,000만 건 이상의 트윗과 8,700만 개 이상의 노드를 포함하는 COVID-HATE 데이터셋을 구축했다.
- 혐오 및 반혐오 감지에 사용할 텍스트 분류기 훈련을 위해 2,400건의 트윗을 수작업으로 레이블링한 데이터셋을 제작했으며, 평균 AUROC가 0.852에 도달했다.
- 사용자가 첫 번째 혐오 트윗을 게재하기 전과 후의 참여도 및 행동 변화를 비교하기 위해 종단적 분석을 적용했다.
- 혐오 및 반혐오 발언자 중 봇 계정을 식별하고 분류하여, 바이럴성 및 팔로워 증가율을 비교했다.
- 혐오 및 반혐오 사용자 간의 사회적 네트워크를 맵핑하여 상호작용 패턴과 콘텐츠 전파를 분석했다.
- 수작업 레이블링된 데이터를 기반으로 지도 학습을 활용해 텍스트 분류 모델을 훈련하고 평가하여 대규모로 혐오 및 반혐오 콘텐츠를 탐지했다.
실험 결과
연구 질문
- RQ1혐오 발언과 반혐오 발언을 한 사용자 간에는 혐오 콘텐츠 게재 이전 및 이후의 참여도 및 바이럴성 패턴에서 어떤 차이가 있는가?
- RQ2봇이 트위터에서 반아시안 혐오 및 반혐오 발언의 확산에 어느 정도 기여하는가?
- RQ3혐오 발언자와 반혐오 발언자는 고립된 극단적 공동체에만 존재하는가, 아니면 이데올로기적 경계를 넘어 상호작용하는가?
- RQ4반혐오 콘텐츠에 노출된 것이 사용자가 혐오 행동을 취할 가능성을 줄이는가?
- RQ5혐오는 온라인 사회 네트워크에서 얼마나 전염성이 있으며, 네트워크 구조는 그 전파에 어떤 역할을 하는가?
주요 결과
- 첫 번째 반아시안 혐오 트윗을 게재한 후 혐오 발언자들은 반혐오 발언자들보다 훨씬 더 높은 참여도와 발언 빈도를 보였다.
- 혐오 발언자 중 10.4%가 봇이었으며, 비봇 사용자보다 더 활발하고 더 혐오스러운 발언을 했고, 혐오 봇은 반혐오 봇보다 더 많은 팔로워를 확보했다.
- 혐오 발언자와 반혐오 발언자 간에 빈번한 상호작용이 있었으며, 이는 두 그룹이 고립된 극단적 공동체에 존재하지 않음을 시사한다.
- 혐오 콘텐츠에 노출된 것이 사용자가 혐오 행동을 취할 가능성을 높였으며, 이는 혐오가 온라인 네트워크에서 전염성 있음을 보여준다.
- 반혐오 메시지는 사용자가 혐오로 전환하는 것을 효과적으로 줄였으며, 이는 극단화를 방지하는 보호적 효과가 있음을 시사한다.
- COVID-HATE 데이터셋 내에서 891,204건의 혐오 트윗과 200,198건의 반혐오 트윗을 식별하여 향후 연구에 유용한 자원을 제공했다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.