QUICK REVIEW

[논문 리뷰] On k-FWE-based critical values for controlling the false discovery proportion under dependence

Sylvain Delattre, Étienne Roquain|arXiv (Cornell University)|2013. 11. 15.

Statistical Methods in Clinical Trials참고 문헌 31인용 수 2

한 줄 요약

이 논문은 로마노와 월프(2007)의 k-FWE 기반 프레임워크를 적응형 임계값으로 조정하여 종속성 하에서 가짜 발현 비율(FDP)을 제어하는 방법을 제안한다. 이 임계값은 k-FWE의 상한값에서 유도된다. 유한 표본 및 점근적 한계를 도출하여, 고차원 검정에서 종속성이 존재하는 상황에서 FDP 제어에 있어 이 방법이 강력한 도구임을 검증한다.

ABSTRACT

The false discovery proportion (FDP) is a convenient way to account for false positives in an high dimensional setting where a large number of tests are performed simultaneously. The Benjamini-Hochberg procedure is now widely used and is known to control the expectation of the FDP, called the false discovery rate (FDR). However, when the individual tests are correlated, controlling the FDR can be unsuitable to ensure that the actually achieved FDP is close (or below) the targeted level. This rises the question of controlling the quantiles of the distribution of the FDP, which is a challenging question that has received a growing attention in the recent literature. This paper elaborates upon the general principle let down by Romano and Wolf (2007) (RW) that builds FDP controlling procedures from $k$-family-wise error rate ($k$-FWE) controlling procedures, while incorporating known dependencies in an appropriate manner. This method is revisited as follows: first, choose a device to upper-bound the $k$-FWE, for all $k$. Second, build the corresponding critical values, possibly adaptively to the number $m_0$ of true null hypotheses. Third, use these critical values into a step-wise procedure (either step-down or step-up). The goal of the paper is to study the obtained FDP when using this methodology. Our first result provides sample finite bounds, while our second result is asymptotic in the number $m$ of hypotheses. Overall, this paper can be seen as a validation of RW's paradigm for controlling the FDP under dependence.

연구 동기 및 목표

고차원 다중 검정에서 종속성이 존재할 경우 FDR 제어의 한계를 해결하기 위해, FDR이 실제 FDP를 목표 수준 근처에 유지하지 못할 수 있음을 고려한다.
검정 통계량이 종속되어 있을 경우에 더 신뢰할 수 있는 오류율 제어를 보장하기 위해 FDP 분포의 분위수를 제어하는 방법을 개발한다.
로마노와 월프(2007)의 파라다임을 알려진 종속성 구조와 적응형 진짜 귀무가설 수 추정을 통합하여 보다 정교하게 검증하고 개선한다.
단계적 상향/하향 절차에서 k-FWE 기반 임계값을 사용할 경우 FDP에 대한 유한 표본 및 점근적 한계를 도출한다.

제안 방법

모든 k에 대해 k-가족-wise 오류율(k-FWE)의 상한값을 사용하여 종속성 하에서 FDP를 제어하는 임계값을 구성한다.
유의력 있는 귀무가설 수(m₀)를 적응적으로 추정하여 임계값의 검정력과 정밀도를 향상시킨다.
유도된 임계값을 기반으로 단계적 절차—상향 또는 하향—를 구성하여 순차적으로 FDP를 제어한다.
종속성 구조를 k-FWE 상한 절차에 통합하여 FDP 제어의 타당성과 민감도를 향상시킨다.
유한 표본 및 m → ∞일 때의 점근적 상황에서, k-FWE 프레임워크를 활용해 FDP 분포에 대한 이론적 한계를 적용한다.
로마노와 월프의(2007) 접근 방식의 일반적 구조를 유지하면서, 적응형 및 종속성 인식 기능을 추가로 확장한다.

실험 결과

연구 질문

RQ1로마노와 월프(2007)의 k-FWE 기반 프레임워크가 일반 종속성 하에서 FDP를 효과적으로 제어하기 위해 적절하게 적응될 수 있는가?
RQ2적응형 m₀ 추정을 사용할 경우 k-FWE 기반 임계값을 사용할 때 FDP에 대한 유한 표본 및 점근적 한계는 무엇인가?
RQ3알려진 종속성 구조를 통합할 경우 FDP 제어 절차의 성능은 어떻게 향상되는가?
RQ4제안된 방법이 실제 FDP가 높은 확률로 목표 수준 이하에 머무르도록 보장하는 조건은 무엇인가?

주요 결과

논문은 k-FWE 기반 임계값을 사용할 경우 FDP에 대한 유한 표본 상한값을 확립하여 오류 제어에 대한 엄밀한 보장을 제공한다.
FDP에 대한 점근적 한계가 유도되었으며, 이는 가설 수 m이 증가함에 따라 FDP 분포를 유지함을 보여준다.
m₀(진짜 귀무가설 수)의 적응형 추정은 FDP 제어를 훼손하지 않으면서 절차의 검정력을 향상시킨다.
이 방법은 종속성 하에서 로마노와 월프(2007)의 파라다임을 신뢰할 수 있는 확장으로 검증되었다.
유도된 임계값을 기반으로 한 단계적 절차(상향 또는 하향)는 유한 표본 및 점근적 영역 모두에서 FDP를 효과적으로 제어한다.
k-FWE 상한 과정에 종속성 정보를 통합함으로써 FDP 제어의 정확성과 강건성은 향상된다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.