Skip to main content
QUICK REVIEW

[논문 리뷰] The Ivory Tower Lost: How College Students Respond Differently than the General Public to the COVID-19 Pandemic

Viet Duong, Phu Pham|arXiv (Cornell University)|2020. 04. 21.
Sentiment Analysis and Opinion Mining참고 문헌 36인용 수 38
한 줄 요약

본 논문은 미국 대학의 12,776명 트위터 팔로워로부터 얻은 73,787건의 COVID-19 관련 트윗을 분석하여, 주제와 감정에서 대학생과 일반 대중을 비교하고, 인구통계 추정, 주제 모델링, 그리고 트랜스포머 기반 감정 분석을 사용한다. 대학생은 더 부정적인 감정을 보이고 학교 관련 이슈에 더 집중한다.

ABSTRACT

Recently, the pandemic of the novel Coronavirus Disease-2019 (COVID-19) has presented governments with ultimate challenges. In the United States, the country with the highest confirmed COVID-19 infection cases, a nationwide social distancing protocol has been implemented by the President. For the first time in a hundred years since the 1918 flu pandemic, the US population is mandated to stay in their households and avoid public contact. As a result, the majority of public venues and services have ceased their operations. Following the closure of the University of Washington on March 7th, more than a thousand colleges and universities in the United States have cancelled in-person classes and campus activities, impacting millions of students. This paper aims to discover the social implications of this unprecedented disruption in our interactive society regarding both the general public and higher education populations by mining people's opinions on social media. We discover several topics embedded in a large number of COVID-19 tweets that represent the most central issues related to the pandemic, which are of great concerns for both college students and the general public. Moreover, we find significant differences between these two groups of Twitter users with respect to the sentiments they expressed towards the COVID-19 issues. To our best knowledge, this is the first social media-based study which focuses on the college student community's demographics and responses to prevalent social issues during a major crisis.

연구 동기 및 목표

  • 대학생과 일반 대중이 COVID-19에 관한 트위터 토론에서 어떻게 다르게 다루는지 측정한다.
  • 팬데믹 기간 동안 각 그룹이 제기한 주요 주제와 이슈를 식별한다.
  • 트위터 데이터를 바탕으로 대학생 인구통계를 추론하는 모델을 개발한다.
  • 주제 기반 하위 집합에 감정 분석을 적용해 정서적 반응을 파악한다.

제안 방법

  • US News 상위 200개 대학의 팔로워의 트위터 데이터를 수집하고(샘플링된 100,000명) 2020년 1월 20일〜3월 20일 사이의 1,873,022건의 트윗을 수집했다.
  • 키워드 목록을 사용해 COVID-19 관련 트윗을 식별하고 12,776명의 사용자로부터 73,787개의 고유 트윗을 추출했다.
  • 감정 인식 토큰화, 맞춤법 교정, 정규화, 해시태그 분절, 그리고 품사/표제어 주석화를 포함한 전처리.
  • M3 딥 러닝 시스템(이름, 화면 이름, 약력, 프로필 이미지)을 사용해 프로필에서 연령, 성별, 조직을 추론한다.
  • 휴먼 심판에 의한 대학생 여부의 골드 표준 하위집합(2,400명)을 주석하고; Bag-of-N-grams(TF-IDF)에서 Random Forest를 학습시키며 PMI 기반 속성 휴리스틱(“my-X” 규칙)을 적용해 식별을 향상시킨다.
  • 표제어 형태소화 토큰에 대해 LDA(55개 주제; 일관도 0.373)로 주제 모델링을 수행하고, 다중-그램을 포함하며; t-SNE로 시각화한다.
  • SemEval-2017 Task 4A 데이터에 대해 RoBERTa와 BERT 베이스라인으로 감정을 평가한다; RoBERTa는 이진/삼진 감정 작업에서 Macro-F1 ≈ 0.806을 달성한다.

실험 결과

연구 질문

  • RQ1대학생과 일반 대중이 Twitter에서 다루는 주요 COVID-19 관련 주제는 무엇인가?
  • RQ2이 주제들에 대해 대학생과 일반 대중의 COVID-19 이슈에 대한 감정은 어떻게 다르게 나타나는가?
  • RQ3트위터 프로필과 내용으로 대학생 인구통계를 얼마나 정확하게 추론할 수 있으며, 이것이 비교 분석에 어떻게 도움을 주는가?
  • RQ4위 인구통계 및 감정 차이가 위기 상황에서 교육자와 정책 결정자에게 어떤 시사점을 주는가?

주요 결과

  • 대학생과 일반 대중은 COVID-19 주제를 다르게 토론하며, 대학생은 학교 폐쇄와 지역 거주 여건에 더 집중한다.
  • 전반적으로 부정적 감정이 더 많이 나타나며, 대학생이 중앙 COVID-19 이슈에 대해 현저히 더 부정적인 감정을 보인다.
  • 사회적 거리두기와 학교 폐쇄와 관련된 주제가 학생과 일반 대중 간 가장 큰 부정성 차이를 보인다(부정 트윗 비율 약 14.5%, 13.8% 각각).
  • 학생들은 원격 수업과 학업 중단에 대해 강한 부정적 반응을 보인다(예: 원격 학습 하위 주제에서 81.3% 부정).
  • 중국 기원 논쟁과 관련된 인종차별 주제가 두드러지며, 인종차별에 대한 부정성이 높다; 연구는 팬데믹 중 동아시아 커뮤니티를 향한 인종차별 표적의 변화가 있음을 지적한다.
  • 대학생의 인구통계 추론은 견고한 성능을 달성(Bag-of-N-grams를 이용한 Random Forest 약 78% 정확도; my-X 휴리스틱으로 약 83%로 개선); 식별된 학생의 성별 분포 약 53.8%가 여성, 연령 분포 대략 19–29세(약 54.1%).
  • RoBERTa 기반 감정 분류가 SemEval-2017 데이터에서 베이스라인보다 우수하며 Macro-F1 ≈ 0.806로, COVID-19 트윗 말뭉치에 대한 신뢰할 수 있는 주제별 감정 분석을 뒷받침한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.