Skip to main content
QUICK REVIEW

[논문 리뷰] Controlling FDR while highlighting distinct discoveries

Eugene Katsevich, Chiara Sabatti|arXiv (Cornell University)|2018. 09. 06.
Gene expression and cancer classification인용 수 2
한 줄 요약

Focused BH는 다중 검정보다 가정의 구조적 관계(예: ICD, GO)가 있을 경우에도 통계적 타당성을 유지하면서 가정된 필터를 적용하여 잘못된 발견률(FDR)을 제어하는 새로운 방법이다. 양의 종속성과 단조성 조건 하에서 FDR 제어를 보장하며, 부족한 중복을 줄이되 추론 보장을 훼손하지 않는 원칙적인 해결책을 제공한다.

ABSTRACT

Scientific hypotheses in a variety of applications have domain-specific structures, such as the tree structure of the International Classification of Diseases (ICD), the directed acyclic graph structure of the Gene Ontology (GO), or the spatial structure in genome-wide association studies. In the context of multiple testing, the resulting relationships among hypotheses can create redundancies among rejections that hinder interpretability. This leads to the practice of filtering rejection sets obtained from multiple testing procedures, which may in turn invalidate their inferential guarantees. We propose Focused BH, a simple, flexible, and principled methodology to adjust for the application of any pre-specified filter. We prove that Focused BH controls the false discovery rate under various conditions, including when the filter satisfies an intuitive monotonicity property and the p-values are positively dependent. We demonstrate in simulations that Focused BH performs well across a variety of settings, and illustrate this method's practical utility via analyses of real datasets based on ICD and GO.

연구 동기 및 목표

  • 나무 또는 그래프와 같은 도메인 특화된 구조를 가진 가정이 있을 때 다중 검정보다의 해석 가능성 문제를 해결하기 위해.
  • 중복을 줄이기 위해 거부 집합을 필터링하는 것과 유효한 통계적 추론을 유지하는 것 사이의 갈등을 해결하기 위해.
  • 다중 검정보다 결과에 사전 지정된 필터를 적용한 후에도 FDR 제어를 유지할 수 있는 방법을 개발하기 위해.
  • p-값의 양의 종속성과 필터의 직관적인 단조성 조건 하에서도 방법이 유효하게 유지되도록 보장하기 위해.
  • 생물의학 분류 및 유전체학과 같은 다양한 분야에 적용 가능한 유연하고 원칙적인 프레임워크를 제공하기 위해.

제안 방법

  • Focused BH는 가정에 대한 구조와 필터 적용에 따라 p-값 임계치를 조정함으로써 Benjamini-Hochberg 절차를 수정한다.
  • 특정 필터에 맞는 조정을 도입하여, 비구별성 또는 중복 발견을 제거한 후에도 FDR이 제어됨을 보장한다.
  • 이 방법은 필터의 단조성 성질에 의존하여, 만약 어떤 가정이 기각되면 그 위계에서 조상 가정들 역시 모두 고려됨을 보장한다.
  • p-값의 부분집합에 대한 양의 회귀 종속성(PRDS) 조건 하에서 FDR 제어를 증명한다. 이는 다중 검정보다에서 흔히 가정되는 조건이다.
  • 특정 필터에 종속되지 않아, 예를 들어 위계에서 잎 노드나 특정 분지만 선택하는 등 사전 지정된 규칙에 적용 가능하다.
  • 계산적으로 효율적이며, 원래 BH 방법의 단순성은 유지하면서도 구조적 인식 능력을 추가한다.

실험 결과

연구 질문

  • RQ1다중 검정보다 거부 집합을 필터링하여 해석 가능성을 향상시킬 수 있는가, 그러나 FDR 제어가 무너지지 않는가?
  • RQ2어떤 조건에서 필터링된 거부 집합이 여전히 유효한 FDR 제어를 유지하는가?
  • RQ3가정에 도메인 구조적 필터를 적용할 때 FDR 임계치를 공식적으로 어떻게 조정할 수 있는가?
  • RQ4p-값 간의 양의 종속성이 존재하는 상황에서도 방법이 유효한가? 이는 실제 데이터에서 흔한 상황이다.
  • RQ5ICD 및 유전자 온톨로지와 같은 다양한 구조적 가정 공간에 대해 이 방법을 민첩하게 적용할 수 있는가?

주요 결과

  • Focused BH는 p-값의 양의 종속성과 필터의 단조성 조건 하에서 FDR 제어를 보장하여 통계적 타당성을 확보한다.
  • 비구별성 또는 중복 발견을 제거한 후에도 강력한 FDR 제어를 유지하여 해석 가능성을 향상시킨다.
  • 시뮬레이션 결과, Focused BH는 다양한 데이터 구조와 필터 규칙에서 잘 작동함을 입증한다.
  • ICD 및 유전자 온톨로지의 실제 데이터 분석에서, Focused BH는 FDR 제어를 유지하면서도 구별되고 의미 있는 발견을 성공적으로 강조하였다.
  • 이 방법은 다양한 유형의 필터에 대해 강건하며, 원천 데이터 분포에 대한 가정이 필요하지 않다.
  • 이 방법은 종종 추론 보장을 훼손하는 즉흥적 필터링에 대한 원칙적인 대안을 제공한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.