[论文解读] Weakly Supervised Veracity Classification with LLM-Predicted Credibility Signals
该论文让指令微调的大语言模型生成18个长期文章可信度信号,并与弱监督融合,在没有 ground-truth 标签的情况下预测真实性,在两个数据集上超越零-shot 和一些有监督基线。
Credibility signals represent a wide range of heuristics typically used by journalists and fact-checkers to assess the veracity of online content. Automating the extraction of credibility signals presents significant challenges due to the necessity of training high-accuracy, signal-specific extractors, coupled with the lack of sufficiently large annotated datasets. This paper introduces Pastel (Prompted weAk Supervision wiTh crEdibility signaLs), a weakly supervised approach that leverages large language models (LLMs) to extract credibility signals from web content, and subsequently combines them to predict the veracity of content without relying on human supervision. We validate our approach using four article-level misinformation detection datasets, demonstrating that Pastel outperforms zero-shot veracity detection by 38.3% and achieves 86.7% of the performance of the state-of-the-art system trained with human supervision. Moreover, in cross-domain settings where training and testing datasets originate from different domains, Pastel significantly outperforms the state-of-the-art supervised model by 63%. We further study the association between credibility signals and veracity, and perform an ablation study showing the impact of each signal on model performance. Our findings reveal that 12 out of the 19 proposed signals exhibit strong associations with veracity across all datasets, while some signals show domain-specific strengths.
研究动机与目标
- 推动使用超越文本内容本身的可信度信号自动检测错误信息。
- 研究指令微调的LLM的零-shot提示是否能匹配经过微调的分类器。
- 评估基于可信度信号的 prompted 弱监督(PWS)在真实性预测中的作用。
- 找出对预测错误信息贡献最大的可信度信号。
- 证明在两个长篇文章错误信息数据集上的鲁棒性。
提出的方法
- 对LLM提示18个可信度信号以获得每个信号的弱标签。
- 使用两步提示方法:先开放式提示,然后再进行映射提示以映射到类别标签。
- 应用简单的字符串匹配将LLM输出映射到信号标签,映射提示作为后备。
- 用Snorkel的标签模型聚合这18个弱信号,在没有GT数据的情况下估计信号准确性。
- 比较两种PWS模式:(L)仅标签模型;(FULL)标签模型加在弱标签上训练的RoBERTa-Base分类器。
- 在三种指令微调LLM(GPT-3.5-Turbo、Alpaca-LoRA-30B、OpenAssistant-30B)和两个数据集上进行评估。
实验结果
研究问题
- RQ1RQ1: 使用指令微调的LLM进行零-shot提示是否与使用GT数据微调的分类器在文章级真实性任务上同样有效?
- RQ2RQ2: 以可信度信号为基础的 prompted 弱监督是否优于零-shot 提示?
- RQ3RQ3: 哪些可信度信号对预测真实性贡献最大?
主要发现
- 带可信度信号的 prompted 弱监督在所有数据集与模型中始终优于零-shot 提示。
- FULL(弱信号加分类器)通常 yields 最佳性能,例如 OpenAssistant-30B-FULL 在 FA-KES 上达到最高的 FA-KES F1 和在 GPT-3.5-Turbo-FULL 上达到最高的 EUvsDisinfo F1-Macro。
- 与有监督的 RoBERTa-Base 相比,FULL 方法在 EUvsDisinfo 上达到更高的 F1-Macro(99.0),在 FA-KES 上也有竞争力/显著提升。
- OpenAssistant-30B-FULL 在 FA-KES 上达到 55.3% 的准确率和 54.8% 的 F1-Macro;在 EUvsDisinfo 上达到 91.3% 的准确率和 85.8% 的 F1-Macro。
- 带 prompted 的 PWS 在模型间比零-shot 增加的平均 F1-Macro 为 +23.1%(FA-KES)和 +92.1%(EUvsDisinfo)。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。