Skip to main content
QUICK REVIEW

[論文レビュー] Clustering and preferential attachment in growing networks

M. E. J. Newman|Apr 11, 2001
Complex Network Analysis Techniques被引用数 22
ひとこと要約

本稿は、ロスアラモス・エプリントアーカイブおよびメドラインからの時間分解能のあるデータを用いて、成長する科学的共同研究ネットワークにおけるクラスタリングおよび優先的接続の実証的証拠を提供する。新規共同研究の確率は、共通の共同研究者数および既存の共同研究者数の両方と増加しており、優先的接続はほぼ直線的傾向に従っており、ネットワークにおけるパワー則的次数分布の理論的根拠を支持する。

ABSTRACT

We study empirically the time evolution of scientific collaboration networks in physics and biology. In these networks, two scientists are considered connected if they have coauthored one or more papers together. We show that the probability of scientists collaborating increases with the number of other collaborators they have in common, and that the probability of a particular scientist acquiring new collaborators increases with the number of his or her past collaborators. These results provide experimental evidence in favor of previously conjectured mechanisms for clustering and power-law degree distributions in networks.

研究の動機と目的

  • ネットワーク成長におけるクラスタリングおよび優先的接続の仮説されたメカニズムを実証的に検証すること。
  • 共同研究の確率が共通の共同研究者数および既存の共同研究者数の増加に伴って増加するかどうかを特定すること。
  • 優先的接続が直線的傾向に従うかどうかを評価し、パワー則的次数分布を説明する要因となるかどうかを検討すること。
  • 科学的共同研究データベースからの時間分解能のあるデータを用いて、ネットワーク成長の順序に関する曖昧さを解消すること。

提案手法

  • 1995–2000年のロスアラモス・エプリントアーカイブおよび1994–1999年のメドラインから、出版順を共同研究のタイミングの代理として用いて共同研究ネットワークを構築した。
  • 次数 $ k $ の頂点に新しい辺が接続する相対的確率 $ R_k $ を定義し、次数分布バイアスを補正するために $ N(t)/n_k(t) $ で重み付けした。
  • 時間順序データを用いて進化するネットワーク構造を追跡し、共通の頂点の2つの隣接頂点が互いに接続されている確率を計算することでクラスタリングを測定した。
  • ヒストグラムベースの重み付け法を用いて $ R_k $ を推定し、均一な接続からの逸脱を評価するための正規化を実施した。
  • パワー則的モデルを $ R_k $ にフィットさせ、線形($ \nu = 1 $)または非線形($ \nu < 1 $)の優先的接続をテストした。
  • 2つの大規模なデータベース間で結果を比較し、発見の整合性および頑健性を検証した。

実験結果

リサーチクエスチョン

  • RQ12人の科学者が共有する共通の共同研究者が増えるほど、彼らの共同研究の確率は上昇するか?
  • RQ2科学者が既存の共同研究者数が増えるにつれて、新たな共同研究者を獲得する確率は上昇するか?
  • RQ3ネットワーク成長における優先的接続は、理論的モデルが予測するように直線的であるか?
  • RQ4観察された次数分布がパワー則からどれほど逸脱しているか、およびその逸脱が線形優先的接続の破綻と相関しているかはいかがなっているか?

主な発見

  • 共通の共同研究者数の増加に伴い、共同研究の確率が顕著に上昇しており、共通の紹介に基づくクラスタリングメカニズムに対する強い実証的支援が得られた。
  • 既存の共同研究者数の増加に伴い、新たな共同研究者を獲得する確率が線形的に上昇しており、優先的接続が支配的な成長メカニズムであることが確認された。
  • 低~中程度の次数において、相対的接続確率 $ R_k $ は次数 $ k $ に対して直線的に増加し、メドラインでは $ \nu = 1.04 \pm 0.04 $、ロスアラモス・アーカイブでは $ \nu = 0.89 \pm 0.98 $ であり、両者とも線形優先的接続と整合的であった。
  • 高次度(物理学では約150、生物医学分野では約600)において $ R_k $ が直線性から逸脱する現象は、次数分布の観察されるカットオフと一致しており、優先的接続の自然な限界を示唆している。
  • 以前の粗い時間分解能を用いた研究では非線形接続($ \nu \approx 0.8 $)が得られたが、本研究では標準的な線形モデルが根本的なメカニズムとして支持された。
  • 本研究は、クラスタリングおよび線形優先的接続がネットワーク成長およびパワー則的次数分布の駆動要因であることを、時間分解能のある直接的実証的検証を初めて提供した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。