Skip to main content
QUICK REVIEW

[論文レビュー] Vocabulary growth in collaborative tagging systems

Ciro Cattuto, Andrea Baldassarri|arXiv (Cornell University)|Apr 25, 2007
Speech and dialogue systems参考文献 10被引用数 45
ひとこと要約

本稿は、500万件の投稿を含む時系列順データセットを用いて、協同的タグ付けシステム del.icio.us におけるタグ語彙の成長を分析している。グローバル語彙およびローカル語彙の両方が、1より小さいべき乗指数を示すことで、非線形的かつ一貫したタグ生成のパターンが、ユーザーおよびリソース全体にわたって存在することを示しており、フォークロノミー進化の背後にある認知的または社会的プロセスを示唆している。

ABSTRACT

We analyze a large-scale snapshot of del.icio.us and investigate how the number of different tags in the system grows as a function of a suitably defined notion of time. We study the temporal evolution of the global vocabulary size, i.e. the number of distinct tags in the entire system, as well as the evolution of local vocabularies, that is the growth of the number of distinct tags used in the context of a given resource or user. In both cases, we find power-law behaviors with exponents smaller than one. Surprisingly, the observed growth behaviors are remarkably regular throughout the entire history of the system and across very different resources being bookmarked. Similar sub-linear laws of growth have been observed in written text, and this qualitative universality calls for an explanation and points in the direction of non-trivial cognitive processes in the complex interaction patterns characterizing collaborative tagging.

研究の動機と目的

  • 協同的タグ付けシステム(del.icio.us など)における異なるタグ数の時間的変化を理解すること。
  • 語彙成長が非線形的か線形的か、および異なる文脈において普遍的なスケーリングパターンを示すかを調査すること。
  • 観察された成長ダイナミクスが、ユーザー行動、システム構造、またはタグ作成における認知的プロセスに起因するかを特定すること。
  • グローバル語彙成長(全体のシステム)とローカル語彙成長(ユーザーごとまたはリソースごと)を区別し、そのスケーリング行動を比較すること。
  • 非線形的成長がユーザー行動パターン、タグの多重性、またはタグ付け行動における意味的制約の結果であるかを検討すること。

提案手法

  • 500万件の del.icio.us 投稿から、タイムスタンプを保持したタグ割り当て(TAS)の時系列順テーブルを構築し、時間的進化を追跡。
  • 累積タグ付与イベントに基づく「内在的時間」を定義し、ユーザー数の増加によるバイアスを低減し、成長ダイナミクスを正規化。
  • グローバルおよびローカル語彙の時間的経過に伴う異なるタグ数をべき乗関数にフィットさせ、成長指数を推定。
  • 最も活発な1,000人のユーザーおよび最もよくブックマークされた1,000のリソースにおける成長指数の分布を分析し、変動性と普遍性を評価。
  • ローカル成長(ユーザーまたはリソースごと)とグローバル成長を比較し、ユーザー数の増加や1投稿あたりの平均タグ数といった線形要因が成立しないことを確認。
  • 統計的分析を用いて、非線形的成長がシステム的特徴か、個別的または集団的行動の反映かを特定。

実験結果

リサーチクエスチョン

  • RQ1協同的タグ付けシステムにおいて、グローバルな異なるタグ数はどのように時間的経過とともに成長するか?
  • RQ2ユーザーごとまたはリソースごとに定義されるローカル語彙は、グローバル語彙と同様に非線形的成長パターンを示すか?
  • RQ3観察された非線形的成長は、ユーザー行動、システム設計、またはタグ作成における認知的プロセスに起因するか?
  • RQ4グローバルレベルの成長指数と、ユーザーおよびリソースごとの指数分布との関係は何か?
  • RQ5観察されたべき乗則スケーリングは、ユーザー数の増加や1投稿あたりの平均タグ数といった単純な線形トレンドで説明可能か?

主な発見

  • del.icio.us におけるグローバル語彙サイズは、1より小さいべき乗指数を示すべき乗則に従い、システム全体の歴史を通じて非線形的成長を示している。
  • ユーザーごとおよびリソースごとのローカル語彙の成長も、べき乗則に従う非線形的パターンを示しており、指数は明確に特徴的な値を中心に集中しているが、グローバル指数とはわずかに異なる。
  • 人気のないリソースでは、ローカル成長指数が少しずつ1に近づく傾向があり、人気の低下に伴いタグ付け行動の変化が示唆される。
  • 非線形的成長は、ユーザー数の増加や1投稿あたりの平均タグ数の線形的増加では説明できず、非自明な背後要因が存在することを示している。
  • 個々のユーザーおよびリソースにおける語彙の変動性が高くても、システム全体の成長パターンは、異なる文脈において顕著に規則的かつ普遍的である。
  • 多様なリソースおよびユーザーにわたる一貫したべき乗則スケーリングは、タグ語彙成長がランダムまたは機械的ダイナミクスではなく、集団的な認知的または社会的プロセスによって支配されていることを示唆している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。