[논문 리뷰] DEAN: Learning Dual Emotion for Fake News Detection on Social Media
이 논문은 소셜 미디어에서 가짜 뉴스를 탐지하기 위해 기사 내용과 사용자 댓글에서 정서 표현을 함께 학습하는 새로운 双정서 기반 가짜 뉴스 탐지 프레임워크인 DEAN을 제안한다. 게재자 중심의 정서적 콘텐츠와 사용자 반응 기반의 정서적 반응을 모두 모델링함으로써, 실제 데이터셋에서 최신 기술 수준의 성능을 달성하며, 소셜 미디어에서 가짜 뉴스를 퇴치하는 데 있어 이중 정서 모델링의 가치를 입증한다.
Microblogging is a popular way for people to post, share, and seek information due to its convenience and low cost. However, it also facilitates the generation and propagation of fake news, which could cause detrimental societal consequences. Detecting fake news on microblogs is important for societal good. Emotion is considered a significant indicator in many fake news detection studies, and most of them utilize emotion mainly through users stances or simple statistical emotional features. In reality, the publishers typically post either a piece of news with intense emotion which could easily resonate with the crowd, or a controversial statement unemotionally aiming to evoke intense emotion among the users. However, existing studies that exploiting the emotion information from both news content and user comments corporately is ignored. Therefore, in this paper, we study the novel problem of learning dual emotion for fake news detection. We propose a new Dual Emotion-based fAke News detection framework (DEAN), which can i) learn content- and comment- emotion representations for publishers and users respectively; and ii) exploit the dual emotion representations simultaneously for fake news detection. Experimental results on real-world datasets demonstrate the effectiveness of the proposed framework.
연구 동기 및 목표
- 기사 콘텐츠와 사용자 댓글 양측에서 정서를 함께 모델링하여 가짜 뉴스 탐지의 격차를 해소한다.
- 가짜 뉴스가 종종 정서적으로 격해진 콘텐츠 또는 반응을 유도하기 위해 의도적으로 도발적인 문장으로 퍼진다는 점을 인식한다.
- 게재자의 정서 표현(콘텐츠 정서)과 사용자 반응 정서를 모두 포괄하는 통합 프레임워크를 개발한다.
- 단일 아키텍처 내에서 두 소스로부터 유용한 정서적 단서를 활용하여 탐지 성능을 향상시킨다.
- 실제 마이크로블로깅 환경에서 이중 정서 표현 학습의 효과를 입증한다.
제안 방법
- 기사 콘텐츠와 사용자 댓글 양측에서 정서를 별도로 인코딩하는 이중 정서 기반 가짜 뉴스 탐지 프레임워크(DEAN)를 제안한다.
- 딥 네트워크를 사용하여 게재자가 올린 마이크로블로그 텍스트에서 콘텐츠 수준의 정서 표현을 학습한다.
- 순차적 모델링 기법을 적용하여 사용자 댓글 수준의 정서 표현을 추출함으로써 집단적 정서 반응을 포착한다.
- 최종 가짜 뉴스 분류를 위해 후기 융합 기법을 통해 콘텐츠 정서 표현과 댓글 정서 표현을 통합한다.
- 라벨이 부여된 가짜 뉴스 및 실재 뉴스 샘플의 지도 신호를 사용하여 엔드 투 엔드 프레임워크를 훈련시킨다.
- 내용과 댓글 양측에서 중요한 정서 어휘를 강조하기 위해 어텐션 메커니즘을 활용한다.
실험 결과
연구 질문
- RQ1기사 콘텐츠와 사용자 댓글 양측에서 정서를 함께 모델링하면 가짜 뉴스 탐지 성능이 향상되는가?
- RQ2콘텐츠 수준의 정서 표현과 댓글 수준의 정서 표현은 가짜 뉴스 탐지에 어떻게 다른 기여를 하는가?
- RQ3게재자의 의도와 사용자 반응이라는 이중 정서 신호를 포착하면 단일 소스 정서 모델링보다 더 나은 탐지 성능을 낼 수 있는가?
- RQ4다양한 정서 표현 패턴을 가진 실제 마이크로블로그 데이터셋 간에 DEAN 프레임워크의 탄력성은 어느 정도인가?
- RQ5콘텐츠의 정서 강도와 댓글의 정서 극성 중 어느 것이 가짜 뉴스 탐지에 더 큰 기여를 하는가?
주요 결과
- DEAN은 실제 마이크로블로그 데이터셋에서 이중 정서 표현을 함께 모델링함으로써 최신 기술 수준의 성능을 달성한다.
- 콘텐츠 정서와 댓글 정서 양측을 통합하면 단일 소스 정서 정보만을 사용하는 모델보다 뚜렷한 성능 향상을 이룬다.
- 특히 정서적 언어가 명시적으로 드러나지 않지만 강한 반응을 유도하기 위해 의도된 뉴스 탐지에 사용자 댓글 정서 표현이 매우 효과적이다.
- 게재자 콘텐츠 정서 표현은 명시적인 정서 표현이 포함된 뉴스에 대해 매우 예측력이 높으며, 이는 탐지에 있어 그 가치를 확인한다.
- 이중 정서 프레임워크는 다양한 데이터셋에 걸쳐 뛰어난 탄력성을 보이며, 특정 플랫폼의 특성에 국한되지 않는 일반화 능력을 입증한다.
- 제거 실험(ablation studies) 결과, 콘텐츠 정서와 댓글 정서 양측 모두 최종 탐지 성능 향상에 의미 있는 기여를 한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.