[論文レビュー] Mean clustering coefficients - On clustering measures for small-world networks
本稿では、スパarsなネットワークに一般的に見られる葉および孤立ノードを除外することで、従来の近傍クラスタリングの低評価を是正する修正されたクラスタリング係数を提案する。θというパラメータを導入し、このようなノードの割合を考慮することで、クラスタリング値は最大140%まで上昇し、特に代謝ネットワークにおいて、実際のネットワークにおけるスモールワールド分類が顕著に変化する。
Many networks exhibit the small-world property of the neighborhood connectivity being higher than in comparable random networks. However, the standard measure of local neighborhood clustering is typically not defined if a node has one or no neighbors. In such cases, local clustering has traditionally been set to zero and this value influenced the global clustering coefficient. Such a procedure leads to underestimation of the neighborhood clustering in sparse networks. We propose to include $ heta$ as the proportion of leafs and isolated nodes to estimate the contribution of these cases and provide a formula for estimating a clustering coefficient excluding these cases from the Watts and Strogatz (1998 Nature 393 440-2) definition of the clustering coefficient. Excluding leafs and isolated nodes leads to values which are up to 140% higher than the traditional values for the observed networks indicating that neighborhood connectivity is normally underestimated. We find that the definition of the clustering coefficient has a major effect when comparing different networks. For metabolic networks of 43 organisms, relations changed for 58% of the comparisons when a different definition was applied. We also show that the definition influences small-world features and that the classification can change from non-small-world to small-world network. We discuss the use of an alternative measure, disconnectedness D, which is less influenced by leafs and isolated nodes.
研究の動機と目的
- 標準定義が葉および孤立ノードをどのように扱うかによる、スパarsなネットワークにおけるクラスタリングの低評価を是正すること。
- 次数 ≤1 のノード(つまり、葉および孤立ノード)を除外することで、スモールワールドネットワーク分析における正確性を向上させる修正されたクラスタリング係数を提案すること。
- 異なるクラスタリング定義がネットワーク分類、特にスモールワールド性に与える影響を評価すること。
- 葉および孤立ノードへの感受性が低い、代替的指標である不連結度 D を導入し、その妥当性を評価すること。
- 生物学的ネットワークにおける比較的ネットワーク解析へのクラスタリング係数定義の影響を定量化すること。
提案手法
- 次数 ≤1 のノード(つまり、葉および孤立ノード)を計算から除外する修正されたクラスタリング係数を定義する。
- θ を用いて、ネットワーク内の葉および孤立ノードの割合を定義し、それがグローバルクラスタリング係数に与える影響を推定する。
- 次数 ≤1 のノードを除外してクラスタリング係数を計算するための式を導出する。これにより、スパarsなネットワークにおける正確性が向上する。
- 実世界のネットワーク、特に43種の生物の代謝ネットワークに、修正された係数を適用し、比較分析を実施する。
- 従来のWatts-Strogatzクラスタリング係数と新しい定義を比較し、クラスタリング値およびスモールワールド分類における変化を評価する。
- 葉および孤立ノードへの感受性を低減する代替指標である不連結度 D の性能を評価する。
実験結果
リサーチクエスチョン
- RQ1スパarsなネットワークにおいて、葉および孤立ノードを除外すると、計算されたクラスタリング係数にどのような影響を与えるか?
- RQ2クラスタリング係数の定義の選択が、ネットワークがスモールワールドと分類されるかどうかに、どの程度影響を与えるか?
- RQ3異なるクラスタリング定義が、特に代謝ネットワークにおいて、比較的ネットワーク解析にどのように影響を与えるか?
- RQ4スモールワールド性は、クラスタリング係数の定義の変更に対してどの程度感受性を示すか?
- RQ5不連結度 D は、葉および孤立ノードへの感受性の面で、標準クラスタリング係数と比べてどのように優れているか?
主な発見
- 葉および孤立ノードを除外することで、従来のWatts-Strogatz定義と比較して、クラスタリング係数は最大140%まで上昇する。
- 43種の生物の代謝ネットワークにおける58%のネットワーク比較において、修正されたクラスタリング係数を用いることで、ネットワーク間の関係性が変化した。
- クラスタリング係数の定義が、ネットワークがスモールワールドと分類されるかどうかに顕著な影響を与える。一部のネットワークは、非スモールワールドからスモールワールドに分類が変更された。
- 修正されたクラスタリング係数は、次数 ≤1 のノードが多数存在するスパarsなネットワークにおける近傍接続性をより正確に反映する。
- 不連結度 D は、葉および孤立ノードの影響をより受けにくく、ネットワーク解析のためのより頑健な代替指標を提供する。
- 本研究では、標準的なクラスタリング測定値が、特に生物学的システムにおいて、スパarsなネットワークで系統的にクラスタリングを低評価していることが示された。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。