Skip to main content
QUICK REVIEW

[논문 리뷰] Trust Oriented Explainable AI for Fake News Detection

Krzysztof Siwek, Daniel Adam Stankowski|arXiv (Cornell University)|2026. 03. 12.
Explainable Artificial Intelligence (XAI)인용 수 0
한 줄 요약

이 논문은 NLP 기반 가짜뉴스 탐지기(LSTM 및 CNN)에 대해 SHAP, LIME, Integrated Gradients를 비교하고 XAI가 투명성을 높이면서도 높은 정확도를 유지함을 보여준다. 각 방법은 고유한 설명 가치를 제공하며 한계가 있다.

ABSTRACT

This article examines the application of Explainable Artificial Intelligence (XAI) in NLP based fake news detection and compares selected interpretability methods. The work outlines key aspects of disinformation, neural network architectures, and XAI techniques, with a focus on SHAP, LIME, and Integrated Gradients. In the experimental study, classification models were implemented and interpreted using these methods. The results show that XAI enhances model transparency and interpretability while maintaining high detection accuracy. Each method provides distinct explanatory value: SHAP offers detailed local attributions, LIME provides simple and intuitive explanations, and Integrated Gradients performs efficiently with convolutional models. The study also highlights limitations such as computational cost and sensitivity to parameterization. Overall, the findings demonstrate that integrating XAI with NLP is an effective approach to improving the reliability and trustworthiness of fake news detection systems.

연구 동기 및 목표

  • NLP 기반 가짜뉴스 탐지에서 투명성의 필요성을 촉진하고 블랙박스 모델 의존도를 줄인다.
  • 선정된 XAI 방법(SHAP, LIME, Integrated Gradients)을 가짜뉴스 분류 맥락에서 비교한다.
  • XAI의 실용적 이점과 한계(계산 비용, 매개변수 민감도, 오해 위험)를 평가한다.
  • XAI를 NLP 아키텍처 및 최종 사용자 연구와의 향후 통합을 위한 기초를 제공한다.

제안 방법

  • ISOT 데이터세트를 이용한 실제와 가짜 뉴스 레이블이 포함된 완전한 NLP 가짜뉴스 탐지 파이프라인을 개발한다.
  • 임베딩 + 분류 계층을 갖춘 두 가지 신경망 아키텍처(LSTM 및 CNN)를 평가한다.
  • 토큰 수준 설명을 위해 XAI 방법(SHAP, LIME, Integrated Gradients)을 통합하고 비교한다.
  • 특성 기여도 지표와 시각화를 사용해 설명의 품질과 신뢰성을 평가한다.
  • 아키텍처 특성 분석 및 시각화를 제시해 설명이 아키텍처 동작을 반영하는 방식을 설명한다.
Figure 2: SHAP visualization for CNN model
Figure 2: SHAP visualization for CNN model

실험 결과

연구 질문

  • RQ1SHAP, LIME, Integrated Gradients가 NLP 모델의 가짜뉴스 탐지에 대한 설명으로서 어떤 성능을 보이는가?
  • RQ2설명 품질은 LSTM과 CNN 아키텍처 간에 어떻게 다르게 나타나는가?
  • RQ3이 설정에서 XAI를 사용하는 데 따른 실용적 한계와 위험은 무엇인가?
  • RQ4오해의 소지가 없도록 평가를 모델 및 아키텍처에 특화해야 하는가?

주요 결과

  • XAI는 일반적으로 투명성을 높이면서도 높은 분류 정확도를 유지한다.
  • SHAP는 상세한 로컬 기여도를 제공하고; LIME은 간단하고 직관적인 설명을 제공하며; Integrated Gradients(IG)은 CNN에서 효율적이다.
  • LSTM의 경우 SHAP가 가장 강한 제거 효과와 가장 높은 AOPC를 보였고; LIME은 성능이 양호하나 완전성에서 다소 낮았으며; IG는 느리고 덜 효과적이었다.
  • CNN의 경우 IG가 완전성과 AOPC의 최적 균형을 빠른 속도로 달성했고; LIME은 중간이며; SHAP는 충분성 및 AOPC 측면에서 뒤처졌다.
  • 설명 품질은 아키텍처 의존적이며 보편적으로 최적의 단일 방법은 없으므로 모델별 평가가 바람직하다.
Figure 3: LIME visualization for CNN model
Figure 3: LIME visualization for CNN model

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.