Skip to main content
QUICK REVIEW

[논문 리뷰] Mean clustering coefficients - On clustering measures for small-world networks

Marcus Kaiser|arXiv (Cornell University)|2008. 02. 18.
Complex Network Analysis Techniques인용 수 1
한 줄 요약

이 논문은 희박한 네트워크에서 흔한 잎과 고립 노드를 제외한 수정된 클러스터링 계수를 제안함으로써, 기존의 이웃 클러스터링을 과소평가하는 문제를 수정한다. θ라는 매개변수를 도입하여 이러한 노드의 비율을 고려함으로써, 클러스터링 값은 최대 140% 증가하고, 특히 대사 네트워크에서 실재 네트워크의 소월드 분류에 상당한 영향을 미친다.

ABSTRACT

Many networks exhibit the small-world property of the neighborhood connectivity being higher than in comparable random networks. However, the standard measure of local neighborhood clustering is typically not defined if a node has one or no neighbors. In such cases, local clustering has traditionally been set to zero and this value influenced the global clustering coefficient. Such a procedure leads to underestimation of the neighborhood clustering in sparse networks. We propose to include $ heta$ as the proportion of leafs and isolated nodes to estimate the contribution of these cases and provide a formula for estimating a clustering coefficient excluding these cases from the Watts and Strogatz (1998 Nature 393 440-2) definition of the clustering coefficient. Excluding leafs and isolated nodes leads to values which are up to 140% higher than the traditional values for the observed networks indicating that neighborhood connectivity is normally underestimated. We find that the definition of the clustering coefficient has a major effect when comparing different networks. For metabolic networks of 43 organisms, relations changed for 58% of the comparisons when a different definition was applied. We also show that the definition influences small-world features and that the classification can change from non-small-world to small-world network. We discuss the use of an alternative measure, disconnectedness D, which is less influenced by leafs and isolated nodes.

연구 동기 및 목표

  • 표준 정의가 잎과 고립 노드를 처리하는 방식으로 인해 희박한 네트워크에서 클러스터링이 과소평가되는 문제를 해결하기 위해.
  • 도로 수 ≤1인 노드를 제외함으로써 소월드 네트워크 분석의 정확성을 향상시키기 위해 수정된 클러스터링 계수를 제안하기 위해.
  • 다양한 클러스터링 정의가 네트워크 분류, 특히 소월드 성질에 어떻게 영향을 미치는지 평가하기 위해.
  • 잎과 고립 노드에 대한 민감도가 낮은 대안 측정법인 이산성 D를 도입하고, 그 탄력성을 평가하기 위해.
  • 생물학적 네트워크 간 비교 네트워크 분석에서 클러스터링 계수 정의의 영향을 정량화하기 위해.

제안 방법

  • 도로 수 ≤1인 노드(즉, 잎과 고립 노드)를 계산에서 제외하는 수정된 클러스터링 계수를 정의한다.
  • θ를 네트워크 내 잎과 고립 노드의 비율로 정의하여, 그들이 전체 클러스터링 계수에 미치는 영향을 추정한다.
  • 도로 수 ≤1인 노드를 제외하여 클러스터링 계수를 계산하는 공식을 유도함으로써, 희박한 네트워크에서의 정확도를 향상시킨다.
  • 실제 네트워크, 특히 43개 생물의 대사 네트워크에 수정된 계수를 적용하여 비교 분석을 수행한다.
  • 기존의 워츠-스트로가츠 클러스터링 계수와 새로운 정의를 비교하여 클러스터링 값과 소월드 분류의 변화를 평가한다.
  • 이산성 D 측정법이 잎과 고립 노드에 대한 민감도를 줄이는 데 얼마나 효과적인지 평가한다.

실험 결과

연구 질문

  • RQ1희박한 네트워크에서 잎과 고립 노드를 제외하면 계산된 클러스터링 계수에 어떤 영향을 미치는가?
  • RQ2클러스터링 계수 정의의 선택이 네트워크를 소월드로 분류하는 데 얼마나 큰 영향을 미치는가?
  • RQ3다른 클러스터링 정의가 대사 네트워크에서 비교 네트워크 분석에 어떻게 영향을 미치는가?
  • RQ4소월드 성질은 클러스터링 계수 정의의 변화에 얼마나 민감한가?
  • RQ5이산성 D 측정법은 표준 클러스터링 계수에 비해 잎과 고립 노드에 대해 얼마나 더 탄력적인가?

주요 결과

  • 기존의 워츠-스트로가츠 정의에 비해, 잎과 고립 노드를 제외함으로써 클러스터링 계수는 최대 140% 증가한다.
  • 43개 생물의 대사 네트워크에서 58%의 네트워크 비교에서 수정된 클러스터링 계수를 사용할 경우 네트워크 간 관계가 변화한다.
  • 클러스터링 계수의 정의는 네트워크를 소월드로 분류하는 데 상당한 영향을 미치며, 일부 네트워크는 비소월드에서 소월드 상태로 전환된다.
  • 수정된 클러스터링 계수는 특히 도로 수 ≤1인 노드가 많은 희박한 네트워크에서 이웃 연결성의 더 정확한 표현을 제공한다.
  • 이산성 D 측정법은 잎과 고립 노드에 덜 영향을 받으며, 네트워크 분석에 더 탄력적인 대안을 제공한다.
  • 이 연구는 표준 클러스터링 측정법이 희박한 네트워크, 특히 생물학적 시스템에서 클러스터링을 체계적으로 과소평가한다는 것을 입증한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.