Skip to main content
QUICK REVIEW

[논문 리뷰] Estimation of edge density in noisy networks

Jinyuan Chang, Eric D. Kolaczyk|arXiv (Cornell University)|2018. 03. 07.
Bioinformatics and Genomic Networks참고 문헌 12인용 수 4
한 줄 요약

이 논문은 최소한의 네트워크 복제본을 사용하여 노드 간 연결 밀도와 오차 비율을 추정하는 방법의 모멘트 추정법을 제안하며, 渐近 정규성(Asymptotic normality)을 입증하고 신뢰구간을 제공한다. 오차 비율이 알려져 있지 않은 상황에서 단일 네트워크 관측만으로는 일관된 추정이 불가능하다는 것을 보여주며, 복제본이 존재할 경우 하위그래프 밀도에 대한 신뢰할 수 있는 불확실성 정량화가 가능하다. 이는 유전자 공발현 네트워크에서 실증적으로 확인되었다.

ABSTRACT

While it is common practice in applied network analysis to report various standard network summary statistics, these numbers are rarely accompanied by some quantification of uncertainty. Yet any error inherent in the measurements underlying the construction of the network, or in the network construction procedure itself, necessarily must propagate to any summary statistics reported. Here we study the problem of estimating the density of edges in a noisy network, as a canonical prototype of the more general problem of estimating density of arbitrary subgraphs. Under a simple model of network error, we show that consistent estimation of such densities is impossible when the rates of error are unknown and only a single network is observed. We then develop method-of-moment estimators of network edge density and error rates for the case where a minimal number of network replicates are available. These estimators are shown to be asymptotically normal as the number of vertices increases to infinity. We also provide the confidence intervals for quantifying the uncertainty in these estimates based on the asymptotic normality. We illustrate the use of our estimators in the context of gene coexpression networks.

연구 동기 및 목표

  • 표준 네트워크 요약 통계량에서의 불확실성 정량화 부족 문제를 해결하기 위해, 특히 연결 밀도에 초점을 맞춘다.
  • 네트워크 오차가 알려져 있지 않고 단일 네트워크만 관측 가능한 상황에서 연결 밀도의 일관된 추정이 가능한지 조사한다.
  • 최소한의 네트워크 복제본이 제공될 때, 단순한 네트워크 오차 모델 하에서 연결 밀도와 오차 비율을 추정하는 방법을 개발한다.
  • 추정량의 渐近 정규성을 확립하여 신뢰구간 구성이 가능하도록 한다.
  • 실제 응용 분야, 예를 들어 유전자 공발현 네트워크에서의 방법의 유용성을 입증한다.

제안 방법

  • 측정 노이즈가 간선 탐지에 어떻게 영향을 미치는지 기술하기 위해 단순한 확률적 네트워크 오차 모델을 사용한다.
  • 다중 네트워크 복제본으로부터 연결 밀도와 오차 비율을 동시에 추정하기 위해 모멘트 방법 추정을 적용한다.
  • 정점 수가 무한히 증가함에 따라 추정량의 渐近 정규성을 도출한다.
  • 추정량의 渐近 정규분포를 기반으로 연결 밀도와 오차 비율에 대한 신뢰구간을 구성한다.
  • 시뮬레이션을 통해 접근법을 검증하고, 유전자 공발현 네트워크에 적용한다.
  • 동일한 오차 과정을 가진 상호 독립적인 네트워크 복제본을 전제로 한다.

실험 결과

연구 질문

  • RQ1오차 비율이 알려져 있지 않고 단일 네트워크만 관측 가능한 상황에서 연결 밀도를 일관되게 추정할 수 있는가?
  • RQ2연결 밀도와 오차 비율의 일관된 추정을 가능하게 하기 위해 필요한 최소한의 네트워크 복제본 수는 얼마인가?
  • RQ3측정 노이즈 존재 하에서 연결 밀도 추정의 불확실성은 어떻게 정량화할 수 있는가?
  • RQ4네트워크 크기가 증가함에 따라 제안된 추정량의 점차적 성질은 무엇인가?
  • RQ5유전자 공발현 네트워크와 같은 실제 생물학적 네트워크에서 추정량은 얼마나 잘 성능을 발휘하는가?

주요 결과

  • 오차 비율이 알려져 있지 않고 단일 네트워크만 관측 가능한 상황에서는 연결 밀도의 일관된 추정이 불가능하다.
  • 최소한의 네트워크 복제본이 존재할 경우, 제안된 모멘트 추정법은 정점 수가 증가함에 따라 渐近 정규성을 확보한다.
  • 추정량의 渐近 정규성에 기반하여 연결 밀도와 오차 비율에 대한 신뢰구간을 구성할 수 있다.
  • 이 방법은 연결 밀도 추정의 불확실성을 성공적으로 정량화하며, 신뢰할 수 있는 네트워크 추론에 필수적이다.
  • 이 접근법은 유전자 공발현 네트워크에서 실증적으로 검증되었으며, 실제 생물학적 데이터에서의 실용성을 입증한다.
  • 이 프레임워크는 노이즈 있는 네트워크 조건 하에서 임의의 하위그래프 밀도 추정에 대한 불확실성 정량화의 기초를 제공한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.