Skip to main content
QUICK REVIEW

[論文レビュー] Wikipedia and Grokipedia: A Comparison of Human and Generative Encyclopedias

Ortal Hadad, Edoardo Loru|arXiv (Cornell University)|Feb 5, 2026
Wikis in Education and Collaboration被引用数 0
ひとこと要約

要約: 本研究はWikipediaとGrokipediaを体系的に比較し、生成的介在が百科事典的内容の選択、書き換え、物語構造、フレーミングにどう影響するかを解明します。

ABSTRACT

We present a comparative analysis of Wikipedia and Grokipedia to examine how generative mediation alters content selection, textual rewriting, narrative structure, and evaluative framing in encyclopedic content. We model page inclusion in Grokipedia as a function of Wikipedia page popularity, density of reference, and recent editorial activity. Inclusion is non-uniform: pages with higher visibility and greater editorial conflict in Wikipedia are more likely to appear in Grokipedia. For included pages, we distinguish between verbatim reproduction and generative rewriting. Rewriting is more frequent for pages with higher reference density and recent controversy, while highly popular pages are more often reproduced without modification. We compare editing activity across the two platforms and estimate page complexity using a fitness-complexity framework to assess whether generative mediation alters patterns of editorial participation. To assess narrative organization, we construct actor-relation networks from article texts using abstract meaning representation. Across multiple topical domains, including U.S. politics, geopolitics, and conspiracy-related narratives, narrative structure remains largely consistent between the two sources. Analysis of lead sections shows broadly correlated framing, with localized shifts in laudatory and conflict-oriented language for some topics in Grokipedia. Overall, generative systems preserve the main structural organization of encyclopedic content, while affecting how content is selected, rewritten, and framed.

研究の動機と目的

  • GrokipediaがWikipediaページを含める際の選択を評価する。
  • 逐語的再現と生成的書き換えの割合とパターンを検討する。
  • アクター–リレーションネットワークを用いて物語構造の変化を評価する。
  • プラットフォーム間での編集者参加とページの複雑さを分析する。
  • リードセクションの評価フレーミングの差異を調査する。

提案手法

  • Grokipediaへのページ包含をWikipediaの人気度、参照密度、最近の編集活動の関数としてロジスティック回帰でモデル化する。
  • 含まれるページについて、逐語的再現とAI駆動の書き換えを区別する。
  • Abstract Meaning Representationを用いて記事テキストからアクター–リレーションネットワークを構築し、物語構造を分析する。
  • プラットフォーム間でのページの複雑さと編集者コミュニティを比較するためにフィットネス–複雑さのフレームワークを適用する。
  • リードセクションのフレーミングを賛美的および対立的な次元で定量化するためにLLMベースの注釈を使用する。
  • Grokipediaの展開時におけるGrokipediaとWikipediaの編集活動を比較する。
Figure 1: Relationship between Wikipedia page characteristics and content selection and transformation on Grokipedia. Predictors are discretized into four groups ( Low , Mid , High , and Very High ) and include page popularity (number of page views), content sourcing (number of references), and edit
Figure 1: Relationship between Wikipedia page characteristics and content selection and transformation on Grokipedia. Predictors are discretized into four groups ( Low , Mid , High , and Very High ) and include page popularity (number of page views), content sourcing (number of references), and edit

実験結果

リサーチクエスチョン

  • RQ1Grokipediaにおけるページ包含は、Wikipediaのページの人気度、参照、編集活動とどのように関連するか?
  • RQ2含まれるGrokipediaページはどの程度書き換えられ、書き換えを予測する要因は何か?
  • RQ3生成的介在は百科事典的内容の物語構造を変えるか?
  • RQ4編集者の参加パターンとページの複雑さはWikipediaとGrokipediaで同様か?
  • RQ5リードセクションの評価フレーミングは二つのプラットフォームでどのように異なるか?

主な発見

  • Grokipediaへの包含は、ページの人気、参照密度、編集活動の増加とともに高まる。
  • 書き換えは、参照が多いページや最近の論争があるページで起こりやすく、非常に人気のあるページはしばしば変更されずに再現される。
  • 物語のアクター–リレーション構造はプラットフォームを超えて大半は保持され、物語の組織におけるグローバルな変化は限定的である。
  • 編集者の参加パターンとページの複雑さはプラットフォーム間で異なり、部分的に異なる編集者コミュニティを示唆する。
  • Grokipediaのリードセクションのフレーミングは一般にWikipediaのフレーミングと相関するが、いくつかのページではGrokipediaでより賛美的またはより対立指向の傾向を示す。
Figure 2: Editing dynamics on Grokipedia. (a) Fractions of Grokipedia and Wikipedia editors who have contributed on a page. Only pages present in both datasets are shown, but the reported fraction is relative to each platform’s entire set of pages. The dashed line corresponds to equal fractions. To
Figure 2: Editing dynamics on Grokipedia. (a) Fractions of Grokipedia and Wikipedia editors who have contributed on a page. Only pages present in both datasets are shown, but the reported fraction is relative to each platform’s entire set of pages. The dashed line corresponds to equal fractions. To

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。