QUICK REVIEW

[논문 리뷰] Taking a Stance on Fake News: Towards Automatic Disinformation Assessment via Deep Bidirectional Transformer Language Models for Stance Detection

Chris Dulhanty, Jason Deglint|arXiv (Cornell University)|2019. 11. 27.

Misinformation and Its Impacts참고 문헌 35인용 수 23

한 줄 요약

이 논문은 RoBERTa, 즉 딥 밴디렉셔널 트랜스포머 언어 모델을 기반으로 한 전이 학습을 사용하여 가짜 뉴스 평가를 위한 최신 기술 수준의 스탠스 검출 모델을 제안한다. 주장과 기사 간의 양방향 크로스 어텐션을 활용함으로써, 이 방법은 FNC-I 기준으로 90.01%의 가중 정확도를 달성하여 이전의 접근 방식을 능가하며, 대규모 언어 모델이 자동화된 위성 정보 탐지에 어떻게 기여할 수 있는지 잠재력을 보여준다.

ABSTRACT

The exponential rise of social media and digital news in the past decade has had the unfortunate consequence of escalating what the United Nations has called a global topic of concern: the growing prevalence of disinformation. Given the complexity and time-consuming nature of combating disinformation through human assessment, one is motivated to explore harnessing AI solutions to automatically assess news articles for the presence of disinformation. A valuable first step towards automatic identification of disinformation is stance detection, where given a claim and a news article, the aim is to predict if the article agrees, disagrees, takes no position, or is unrelated to the claim. Existing approaches in literature have largely relied on hand-engineered features or shallow learned representations (e.g., word embeddings) to encode the claim-article pairs, which can limit the level of representational expressiveness needed to tackle the high complexity of disinformation identification. In this work, we explore the notion of harnessing large-scale deep bidirectional transformer language models for encoding claim-article pairs in an effort to construct state-of-the-art stance detection geared for identifying disinformation. Taking advantage of bidirectional cross-attention between claim-article pairs via pair encoding with self-attention, we construct a large-scale language model for stance detection by performing transfer learning on a RoBERTa deep bidirectional transformer language model, and were able to achieve state-of-the-art performance (weighted accuracy of 90.01%) on the Fake News Challenge Stage 1 (FNC-I) benchmark. These promising results serve as motivation for harnessing such large-scale language models as powerful building blocks for creating effective AI solutions to combat disinformation.

연구 동기 및 목표

소셜 미디어 및 디지털 뉴스를 통해 퍼지는 위성 정보의 증가하는 사회적 위협을 다루기 위해.
확장 가능한 자동 사실 확인 시스템을 위한 기초 단계로 자동 스탠스 검출을 향상시키기 위해.
수동으로 설계된 특징이나 浅층 워드 임베딩에 의존하는 이전 방법의 한계를 극복하기 위해.
위성 정보 탐지에서 대규모 깊이의 양방향 트랜스포머 모델의 효과성을 탐색하기 위해.
FNC-I 데이터셋에서 새로운 최고 성능 기준을 설정하기 위해.

제안 방법

스탠스 검출을 위해 주장-기사 쌍에 대해 RoBERTa 기반의 딥 밴디렉셔널 트랜스포머 언어 모델을 피나이닝하는 것.
자기 어텐션과 양방향 크로스 어텐션을 사용한 페어 인코딩을 통해 주장과 기사 간의 문맥적 관계를 모델링하는 것.
대규모 비라벨 텍스트에서 사전 훈련한 후 FNC-I 데이터셋에서 전이 학습을 수행하는 것.
동의, 반대, 스탠스 없음, 관련 없음의 네 가지 스탠스 클래스 중 하나를 예측하기 위해 분류 헤드를 사용하는 것.
교차 엔트로피 손실과 Adam 최적화를 사용한 표준 NLP 훈련 절차를 통해 모델을 최적화하는 것.
RoBERTa가 학습한 계층적이고 문맥 기반 표현을 활용하여 위성 정보에서 미묘한 언어 패턴을 포착하는 것.

실험 결과

연구 질문

RQ1RoBERTa와 같은 대규모 깊이의 양방향 트랜스포머 모델이 기존의 특징 기반 또는 얕은 임베딩 방법보다 위성 정보의 스탠스 검출에서 더 우수한 성능을 보일 수 있는가?
RQ2주장과 기사 간의 양방향 크로스 어텐션은 스탠스 분류 성능 향상에 어느 정도 기여하는가?
RQ3RoBERTa를 사용한 전이 학습을 통해 FNC-I 벤치마크에서 어떤 정도의 정확도를 달성할 수 있는가?
RQ4가짜 뉴스 챌린지 이후로 발표된 최신 기술 수준의 모델들과 비교해 본다면, 제안된 방법은 어떻게 다른가?
RQ5이러한 모델을 실제 사실 확인 시스템에 배포할 경우 도사되는 윤리적 리스크와 제약은 무엇인가?

주요 결과

제안된 RoBERTa 기반 모델은 FNC-I 벤치마크에서 90.01%의 가중 정확도를 달성하여 새로운 최고 성능 기록을 수립했다.
모델은 표준 정확도 93.71%를 기록했으며, 이는 이전의 방법들 중 Zhang 등(2019)의 88.15% 가중 정확도를 크게 뛰어넘는 성과이다.
이전 방법 대비 성능 향상은 2017년 가짜 뉴스 챌린지 종료 이후 오차율이 약 8% 감소한 것으로 나타났다.
대규모 사전 훈련을 통해 학습된 깊이의 문맥 기반 표현이 위성 정보 맥락에서의 스탠스 검출에 효과적이라는 점을 입증했다.
원래의 가짜 뉴스 챌린지에서 상위 3개의 모델과 이후의 모든 주요 후속 접근 방식보다 FNC-I 테스트 세트에서 뛰어난 성능을 보였다.
결과는 양방향 크로스 어텐션과 RoBERTa를 활용한 전이 학습이 자동 스탠스 검출에 강력한 프레임워크로 기능할 수 있음을 검증한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.