[논문 리뷰] Re-Search for The Truth: Multi-round Retrieval-augmented Large Language Models are Strong Fake News Detectors
STEEL은 다단계 웹 증거 검색을 활용하여 주장을 검증하고 설명을 제공하는 엔드-투-엔드 검색 강화 LLM 프레임워크로, 세 가지 실제 데이터셋에서 가짜 뉴스 탐지 성능이 우수합니다.
The proliferation of fake news has had far-reaching implications on politics, the economy, and society at large. While Fake news detection methods have been employed to mitigate this issue, they primarily depend on two essential elements: the quality and relevance of the evidence, and the effectiveness of the verdict prediction mechanism. Traditional methods, which often source information from static repositories like Wikipedia, are limited by outdated or incomplete data, particularly for emerging or rare claims. Large Language Models (LLMs), known for their remarkable reasoning and generative capabilities, introduce a new frontier for fake news detection. However, like traditional methods, LLM-based solutions also grapple with the limitations of stale and long-tail knowledge. Additionally, retrieval-enhanced LLMs frequently struggle with issues such as low-quality evidence retrieval and context length constraints. To address these challenges, we introduce a novel, retrieval-augmented LLMs framework--the first of its kind to automatically and strategically extract key evidence from web sources for claim verification. Employing a multi-round retrieval strategy, our framework ensures the acquisition of sufficient, relevant evidence, thereby enhancing performance. Comprehensive experiments across three real-world datasets validate the framework's superiority over existing methods. Importantly, our model not only delivers accurate verdicts but also offers human-readable explanations to improve result interpretability.
연구 동기 및 목표
- 가짜 뉴스 탐지에서 정적 지식원과 단일 샷 검색의 한계를 해결한다.
- 주장을 검증하기 위해 Internet에서 증거를 수집하는 자동화된 프레임워크를 개발한다.
- 결과 해석 가능성을 높이고 설명을 제공하여 결과의 투명성을 개선한다.
- 무거운 모델 학습이 필요 없는 즉시 사용 가능한 오픈소스 구현을 가능하게 한다.
제안 방법
- 웹 기반 증거 검색을 의미론적 필터링 및 문서/텍스트 블록 검색과 통합한다.
- 수집된 증거를 바탕으로 LLM이 추론하고 신뢰도 점수와 함께 true/false/NEI를 출력한다.
- 증거가 충분하지 않을 때 업데이트된 질의를 생성하는 다단계 재검색 메커니즘을 구현한다.
- 이후 판단을 안내하고 중복성을 줄이기 위한 증거 풀(확정된 증거)을 도입한다.
- LLM의 신뢰도 점수 보정에 과신도 조정을 적용한다.
- 실제 데이터셋을 사용해 평가하고 광범위한 기준선과 비교한다.
실험 결과
연구 질문
- RQ1다단계의 인터넷 기반 검색이 단일 샷 방법보다 가짜 뉴스 탐지를 개선할 수 있는가?
- RQ2재검색 메커니즘이 증거 품질과 검증 정확도에 어떤 영향을 미치는가?
- RQ3검색 깊이(k)와 증거 길이(l)가 데이터셋 전반의 성능에 어떤 영향을 미치는가?
- RQ4STEEL이 정확성 및 해석가능성 측면에서 최첨단 증거 기반 및 LLM 기반 기준선과 어떻게 비교되는가?
주요 결과
| 방법 | LIAR F1-Ma | LIAR F1-Mi | LIAR F1-T | LIAR P-T | LIAR R-T | LIAR F1-F | LIAR P-F | LIAR R-F |
|---|---|---|---|---|---|---|---|---|
| DeClarE | 0.573 | 0.571 | 0.531 | 0.550 | 0.546 | 0.619 | 0.587 | 0.597 |
| HAN | 0.588 | 0.591 | 0.563 | 0.545 | 0.532 | 0.606 | 0.618 | 0.611 |
| EHIAN | 0.591 | 0.593 | 0.559 | 0.543 | 0.548 | 0.630 | 0.603 | 0.617 |
| MAC | 0.603 | 0.601 | 0.562 | 0.558 | 0.567 | 0.625 | 0.623 | 0.621 |
| GET | 0.614 | 0.610 | 0.572 | 0.567 | 0.579 | 0.641 | 0.654 | 0.632 |
| MUSER | 0.645 | 0.642 | 0.647 | 0.640 | 0.654 | 0.643 | 0.650 | 0.636 |
| ReRead | 0.611 | 0.615 | 0.587 | 0.581 | 0.596 | 0.633 | 0.628 | 0.626 |
| GPT-3.5-turbo | 0.563 | 0.541 | 0.559 | 0.572 | 0.567 | 0.555 | 0.564 | 0.560 |
| Vicuna-7B | 0.528 | 0.535 | 0.521 | 0.543 | 0.552 | 0.519 | 0.538 | 0.526 |
| WEBGLM-2B | 0.601 | 0.597 | 0.558 | 0.563 | 0.571 | 0.622 | 0.604 | 0.618 |
| ProgramFC | 0.631 | 0.613 | 0.637 | 0.607 | 0.639 | 0.625 | 0.611 | 0.628 |
| STEEL | 0.714* | 0.689* | 0.685* | 0.680* | 0.691* | 0.743* | 0.725* | 0.752* |
- STEEL은 세 가지 실제 데이터셋에서 최첨단 기준선을 상회하며, 매크로 F1 및 마이크로 F1에서 각각 5포인트 이상 개선을 보인다.
- LIAR, CHEF, PolitiFact에서도 강력한 가짜 뉴스 탐지를 달성하며 여러 지표에서 통계적으로 유의미한 개선을 보인다(*로 표기).
- 재검색 메커니즘은 직접 검색, 키워드 검색 또는 패러프레이즈 전략보다 더 나은 증거 품질을 산출한다.
- 최적의 검색 설정은 세 개의 URL과 전체 길이 증거(l=all)가 성능을 극대화한다.
- 소거 실험은 검색 또는 재검색 제거가 성능을 저하시키며 두 모듈의 필수적 역할을 확인시킨다.
- 설명가능성 연구는 일관되고 인간이 읽을 수 있는 설명과 판결에 대한 증거 귀속을 보여준다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.