Skip to main content
QUICK REVIEW

[논문 리뷰] Rumor Detection and Classification for Twitter Data

Sardar Hamidian, Mona Diab|arXiv (Cornell University)|2019. 11. 25.
Misinformation and Its Impacts인용 수 65
한 줄 요약

논문은 Twitter 데이터를 대상으로 루머를 탐지하고 이를 분류하기 위한 두 단계 접근법을 제안하고, 새로운 특징과 전처리 전략을 도입하여 혼합 루머 데이터에서 f-measure >0.82와 단일 루머 데이터셋에서 84% 정확도를 달성했다.

ABSTRACT

With the pervasiveness of online media data as a source of information verifying the validity of this information is becoming even more important yet quite challenging. Rumors spread a large quantity of misinformation on microblogs. In this study we address two common issues within the context of microblog social media. First we detect rumors as a type of misinformation propagation and next we go beyond detection to perform the task of rumor classification. WE explore the problem using a standard data set. We devise novel features and study their impact on the task. We experiment with various levels of preprocessing as a precursor of the classification as well as grouping of features. We achieve and f-measure of over 0.82 in RDC task in mixed rumors data set and 84 percent in a single rumor data set using a two-step classification approach.

연구 동기 및 목표

  • 널리 퍼져 있는 온라인 마이크로블로그 데이터에서 정보를 검증해야 한다는 필요성을 제기하고, 잘못된 정보의 확산을 다룬다.
  • 루머를 탐지한 후 분류하는 두 단계 파이프라인을 개발한다.
  • 루머 관련 분류 성능을 개선하기 위한 특징 엔지니어링 및 전처리 전략을 탐색한다.
  • 특징 그룹화가 분류 결과에 미치는 영향을 평가한다.

제안 방법

  • 루머 탐지와 후속 분류를 위한 두 단계 분류 파이프라인을 정의한다.
  • 새로운 특징 세트를 제안하고 성능에 대한 영향을 연구한다.
  • 분류 전 다양한 수준의 텍스트 전처리를 실험한다.
  • 특징을 그룹화하여 정확도와 견고성에 미치는 결합 효과를 평가한다.
  • 표준 트위터 루머 데이터셋을 사용하여 성능을 평가한다.

실험 결과

연구 질문

  • RQ1트위터 데이터에서 루머를 잘못된 정보의 확산 형태로 효과적으로 탐지할 수 있는가?
  • RQ2두 단계 접근이 단일 단계 방법에 비해 루머 탐지 및 후속 분류를 개선하는가?
  • RQ3전처리 수준과 특징 그룹화가 분류 성능에 미치는 영향은 무엇인가?

주요 결과

데이터세트작업/단계지표
Mixed rumors data setRDC taskF-measureover 0.82
Single rumor data setClassificationAccuracy84 percent
  • 두 단계 접근 방식은 RDC 작업의 혼합 루머 데이터 세트에서 f-measure가 0.82를 넘는다.
  • 두 단계 접근 방식은 단일 루머 데이터 세트에서 84%의 정확도를 달성한다.
  • 새로운 특징과 전처리 전략이 성능 향상에 기여한다.
  • 특징 그룹화가 분류 모델의 효과에 영향을 미친다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.