[论文解读] Mean clustering coefficients - On clustering measures for small-world networks
本文提出了一种修正的聚类系数,排除了在稀疏网络中常见的叶节点和孤立节点,从而纠正了传统方法对邻域聚类的低估。通过引入参数θ以考虑此类节点的比例,该方法使聚类值最高提升140%,并显著改变了真实网络中的小世界分类,尤其在代谢网络中表现明显。
Many networks exhibit the small-world property of the neighborhood connectivity being higher than in comparable random networks. However, the standard measure of local neighborhood clustering is typically not defined if a node has one or no neighbors. In such cases, local clustering has traditionally been set to zero and this value influenced the global clustering coefficient. Such a procedure leads to underestimation of the neighborhood clustering in sparse networks. We propose to include $ heta$ as the proportion of leafs and isolated nodes to estimate the contribution of these cases and provide a formula for estimating a clustering coefficient excluding these cases from the Watts and Strogatz (1998 Nature 393 440-2) definition of the clustering coefficient. Excluding leafs and isolated nodes leads to values which are up to 140% higher than the traditional values for the observed networks indicating that neighborhood connectivity is normally underestimated. We find that the definition of the clustering coefficient has a major effect when comparing different networks. For metabolic networks of 43 organisms, relations changed for 58% of the comparisons when a different definition was applied. We also show that the definition influences small-world features and that the classification can change from non-small-world to small-world network. We discuss the use of an alternative measure, disconnectedness D, which is less influenced by leafs and isolated nodes.
研究动机与目标
- 解决标准定义对叶节点和孤立节点的处理导致稀疏网络中聚类被低估的问题。
- 提出一种修正的聚类系数,排除度数≤1的节点,以提高小世界网络分析的准确性。
- 评估不同聚类系数定义对网络分类的影响,特别是小世界特性的影响。
- 引入并评估一种替代度量——非连通性D的稳健性,该度量对叶节点和孤立节点的敏感性较低。
- 量化聚类系数定义对生物网络中比较网络分析的影响。
提出的方法
- 定义一种修正的聚类系数,从计算中排除度数为1或0的节点(即叶节点和孤立节点)。
- 引入θ作为网络中叶节点和孤立节点所占比例,以估计其对全局聚类系数的影响。
- 推导出一种公式,通过排除度数≤1的节点来计算聚类系数,从而提高稀疏网络中的准确性。
- 将修正后的系数应用于真实网络,特别是43种生物体的代谢网络,进行比较分析。
- 将传统Watts-Strogatz聚类系数与新定义的结果进行比较,评估聚类值和小世界分类的变化。
- 评估替代度量非连通性D在降低对叶节点和孤立节点敏感性方面的表现。
实验结果
研究问题
- RQ1在稀疏网络中,排除叶节点和孤立节点如何影响计算出的聚类系数?
- RQ2聚类系数定义的选择在多大程度上改变了网络被分类为小世界网络的结果?
- RQ3不同聚类系数定义如何影响比较网络分析,特别是在代谢网络中的影响?
- RQ4小世界特性对聚类系数定义的变化有多敏感?
- RQ5与标准聚类系数相比,非连通性D度量在对叶节点和孤立节点的稳健性方面表现如何?
主要发现
- 与传统的Watts-Strogatz定义相比,排除叶节点和孤立节点可使聚类系数最高提升140%。
- 在43种生物体的代谢网络中,58%的网络比较关系在使用修正聚类系数后发生了改变。
- 聚类系数的定义显著影响网络被分类为小世界网络的结果,部分网络甚至从非小世界状态转变为小世界状态。
- 修正后的聚类系数更准确地反映了稀疏网络中邻域连通性,尤其在大量节点度数≤1的情况下。
- 非连通性D度量受叶节点和孤立节点的影响较小,为网络分析提供了更具稳健性的替代方案。
- 本研究表明,标准聚类度量在稀疏网络中系统性地低估了聚类程度,尤其在生物系统中表现明显。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。