[논문 리뷰] Understanding the perception of COVID-19 policies by mining a multilanguage Twitter dataset
이 논문은 NLP, 텍스트 마이닝, 네트워크 분석을 사용해 다국어 트위터 데이터를 분석하여 COVID-19 정책에 대한 담론을 시간에 따라 포착하고 팬데믹 초기 단계의 글로벌 다국어 트윗 데이터셋을 소개합니다.
The objective of this work is to explore popular discourse about the COVID-19 pandemic and policies implemented to manage it. Using Natural Language Processing, Text Mining, and Network Analysis to analyze corpus of tweets that relate to the COVID-19 pandemic, we identify common responses to the pandemic and how these responses differ across time. Moreover, insights as to how information and misinformation were transmitted via Twitter, starting at the early stages of this pandemic, are presented. Finally, this work introduces a dataset of tweets collected from all over the world, in multiple languages, dating back to January 22nd, when the total cases of reported COVID-19 were below 600 worldwide. The insights presented in this work could help inform decision makers in the face of future pandemics, and the dataset introduced can be used to acquire valuable knowledge to help mitigate the COVID-19 pandemic.
연구 동기 및 목표
- COVID-19 및 관련 정책에 관한 대중적 담론을 탐색한다.
- 팬데믹에 대한 반응이 시간에 따라 어떻게 진화하는지 식별한다.
- 팬데믹 초기 단계부터 트위터에서 정보와 허위정보가 어떻게 확산되는지 이해한다.
- 미래의 팬데믹 연구를 위한 다국어 트위터 데이터셋을 제공한다.
제안 방법
- COVID-19 관련 트윗을 처리하기 위해 자연어 처리를 사용한다.
- 주제와 감정을 추출하기 위해 텍스트 마이닝 기법을 적용한다.
- 정보 전송과 담론 연결을 연구하기 위해 네트워크 분석을 활용한다.
- 시간에 따른 반응의 시간적 변화를 분석한다.
- 2020년 1월 22일로 거슬러 올라가는 다국어 트위터 데이터셋을 수집하고 공개한다.
실험 결과
연구 질문
- RQ1시간에 따라 트위터 담론에서 COVID-19 정책과 관련된 주제는 무엇이 지배적인가?
- RQ2팬데믹에 대한 반응은 언어와 지역에 따라 어떻게 다르는가?
- RQ3팬데믹 초기 단계에서 트위터를 통해 정보와 허위정보가 어떻게 확산되었는가?
- RQ4다국어 트윗 데이터셋이 향후 팬데믹 의사결정에 어떤 통찰을 제공할 수 있는가?
주요 결과
- 팬데믹과 정책 조치에 대한 일반적인 반응 식별.
- 2020년 초부터 트위터에서 정보와 허위정보가 어떻게 전파되었는지에 대한 증거.
- COVID-19 정책 담론이 어떻게 진화했는지에 대한 시간적 통찰.
- 2020년 1월 22일 이후의 전 세계 트윗을 포함하는 공개 가능한 다국어 트윗 데이터세트.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.