Skip to main content
QUICK REVIEW

[论文解读] Is Grokipedia Right-Leaning? Comparing Political Framing in Wikipedia and Grokipedia on Controversial Topics

Philipp Eibl, Erica Coppolillo|arXiv (Cornell University)|Jan 21, 2026
Wikis in Education and Collaboration被引用 0
一句话总结

该论文在六个有争议的主题上比较维基百科与 Grokipedia,以分析语义框架与政治取向,结果显示两者通常偏左,但 Grokipedia 显示更多偏右的内容与在有争议主题上的更大语义分歧。

ABSTRACT

Online encyclopedias are central to contemporary information infrastructures and have become focal points of debates over ideological bias. Wikipedia, in particular, has long been accused of left-leaning bias, while Grokipedia, an AI-generated encyclopedia launched by xAI, has been framed as a right-leaning alternative. This paper presents a comparative analysis of Wikipedia and Grokipedia on well-established politically contested topics. Specifically, we examine differences in semantic framing, political orientation, and content prioritization. We find that semantic similarity between the two platforms decays across article sections and diverges more strongly on controversial topics than on randomly sampled ones. Additionally, we show that both encyclopedias predominantly exhibit left-leaning framings, although Grokipedia exhibits a more bimodal distribution with increased prominence of right-leaning content. The experimental code is publicly available.

研究动机与目标

  • 评估有争议主题与非有争议主题在平台文章段落的语义相似性。
  • 量化句子的政治取向,以比较两个平台的框架。
  • 评估文章顶部对左倾与右倾内容的内容优先级。
  • 检查政治倾向分布的双峰性及平台层面的差异。

提出的方法

  • 组装六个有争议主题(由调查民调确定:堕胎、大麻合法化、气候变化、性别认同、枪支管制、移民)对应的 Grokipedia 与 Wikipedia 配对语料库。
  • 预处理以去除非文本内容,并按标题/URL 等价对齐文章。
  • 使用 GPT-5 计算段落级嵌入,并在段落之间执行最佳匹配余弦相似度。
  • 对基于 RoBERTA 的政治立场分类器进行微调(España-Bonet 2023,使用大型报纸语料库),对每页的句子打分至左-右尺度。
  • 使用 t 检验和 Hartigan 的 Dip 检验评估政治取向分布的分布情况与双峰性。
  • 使用 nDCG 评估首页内容排名,以比较左倾与右倾句子在文章中的突出程度。

实验结果

研究问题

  • RQ1 Grokipedia 与 Wikipedia 在有争议主题的段落中是否呈现不同的语义框架?
  • RQ2哪一个平台呈现更强的右倾内容,以及两个平台之间的双峰性差异如何?
  • RQ3在各平台文章顶部部分,左倾和右倾内容的排序情况如何?
  • RQ4在跨平台比较时,关于有争议主题的语义相似度是否低于非争议主题?
  • RQ5解释观察到的框架差异的因素(如文章结构或来源等)?

主要发现

  • 对应的 Grokipedia 与 Wikipedia 段落在文章推进过程中语义相似度下降,对有争议主题的分歧更大。
  • 两个平台都主要呈现左倾框架,但 Grokipedia 的双峰分布更显著,右倾内容更多。
  • Grokipedia 的右倾材料在页面上往往放置在比 Wikipedia 更高的位置,显示内容放置动态的差异。
  • 在比较文本的前 18% 时,Wikipedia 在大多数主题上更常将左倾内容置于更高位置,而两个平台之间右倾内容的差距更大。
  • 随机的非争议跨平台文章显示的语义相似度高于有争议的文章,表明政治因素驱动分歧。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。