Skip to main content
QUICK REVIEW

[論文レビュー] Efficient Algorithms for Citation Network Analysis

Vladimir Batagelj|arXiv (Cornell University)|Sep 14, 2003
Rough Sets and Fuzzy Logic参考文献 11被引用数 222
ひとこと要約

本稿では、HummonとDoreianの引用ネットワークの弧重み(SPLCおよびSPNP)を計算する線形時間アルゴリズムを提示し、大規模な引用ネットワークの効率的な解析を可能にしている。この手法は、主路線と重要な部分ネットワークを効率的に同定でき、SOMおよび米国特許ネットワークを用いた実証により、大規模ネットワークにおけるスケーラビリティが顕著に向上している。

ABSTRACT

In the paper very efficient, linear in number of arcs, algorithms for determining Hummon and Doreian's arc weights SPLC and SPNP in citation network are proposed, and some theoretical properties of these weights are presented. The nonacyclicity problem in citation networks is discussed. An approach to identify on the basis of arc weights an important small subnetwork is proposed and illustrated on the citation networks of SOM (self organizing maps) literature and US patents.

研究の動機と目的

  • 大規模ネットワークにおける引用ネットワークの弧重み(SPLCおよびSPNP)を計算するスケーラブルなアルゴリズムの開発。
  • 数千ノードを含む引用ネットワークにおける主路線解析の計算ボトルネックの解消。
  • 大規模引用ネットワークにおける構造的に重要な部分ネットワークを同定する実用的手法の提供。
  • 米国特許やSOM文献からの実世界の引用ネットワークの解析を支援。
  • Pajekソフトウェアにアルゴリズムを実装・統合し、ネットワーク解析のアクセス性を向上。

提案手法

  • 弧の数を表すmを用いて、O(m)の線形時間アルゴリズムを提案し、SPLCおよびSPNPの弧重みを計算。
  • 有向無閉路引用ネットワークのトポロジカル順序を用いて、経路を効率的に動的計画法で処理。
  • 最大要素から最小要素へ向かう後退経路数の計算に、逆関係R^invを適用。
  • 到達可能性と経路の存在をモデル化するため、推移的かつ反射的閉包(Q^*)を用いる。
  • アルゴリズム処理のためのネットワーク構造の簡略化を目的に、「プレプリント変換」を導入。
  • Pajek(Windowsベースの大規模ネットワーク解析ツール)にアルゴリズムを実装し、非営利利用をサポート。

実験結果

リサーチクエスチョン

  • RQ1SPLCおよびSPNPの弧重みは、大規模引用ネットワークでどのように効率的に計算できるか?
  • RQ2引用ネットワークにおける主路線重みの計算の計算量的複雑度は何か?
  • RQ3提案されたアルゴリズムは、数十万ノードおよび数百万の弧を含む引用ネットワークにもスケーラブルに適用可能か?
  • RQ4引用ネットワークにおける弧重みを用いて、最も重要な部分ネットワークをどのように同定できるか?
  • RQ5有向無閉路引用ネットワークにおいて、SPLCおよびSPNP重みが示す理論的性質は何か?

主な発見

  • 提案されたアルゴリズムは、弧の数に比例するO(m)時間でSPLCおよびSPNP重みを計算可能であり、線形時間である。
  • 本手法は、SOM引用ネットワークおよび米国特許ネットワークにおいて、主路線と重要な部分ネットワークを効果的に同定した。
  • アルゴリズムはPajekに実装・統合され、最大370万ノードおよび1650万弧のネットワーク解析が可能になった。
  • 理論的解析により、有向無閉路引用ネットワークでは、すべてのノードが最小要素から到達可能であり、最大要素に到達可能であることが確認された。
  • Web of ScienceおよびHistCiteデータからの実際の引用ネットワーク(最大8,843ノード、41,609弧)に対しても処理可能である。
  • アルゴリズムは循環成分(例:Zewailネットワークにおけるサイズ2の強連結成分が38個)の処理をサポートしているが、コア計算では無閉路性を仮定している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。