[论文解读] Combining p-values via averaging
本文提出了一种通过平均结合p值的广义框架,通过使用广义均值(算术均值、几何均值、调和均值)和数据驱动的缩放因子,扩展了经典的Fisher方法和Bonferroni方法。主要贡献在于证明了p值的调和均值可按$\ln K$(渐近意义下)进行缩放,从而得到一个有效且保守的p值,进而提升了在依赖结构下的多重假设检验程序的统计功效。
This paper proposes general methods for the problem of multiple testing of a single hypothesis, with a standard goal of combining a number of p-values without making any assumptions about their dependence structure. An old result by Rüschendorf and, independently, Meng implies that the p-values can be combined by scaling up their arithmetic mean by a factor of 2 (and no smaller factor is sufficient in general). A similar result about the geometric mean (Mattner) replaces 2 by $e$. Based on more recent developments in mathematical finance, specifically, robust risk aggregation techniques, we extend these results to generalized means; in particular, we show that $K$ p-values can be combined by scaling up their harmonic mean by a factor of $\ln K$ (asymptotically as $K o\infty$). This leads to a generalized version of the Bonferroni-Holm procedure. We also explore methods using weighted averages of p-values. Finally, we discuss the efficiency of various methods of combining p-values and how to choose a suitable method in light of data and prior information.
研究动机与目标
- 开发一种通用、无假设的p值合并方法,将多个p值合并为一个有效p值,而无需假设独立性。
- 扩展经典结果(如Rüschendorf、Mattner)中关于使用广义均值和鲁棒风险聚合技术对p值进行平均的研究。
- 通过基于广义均值的可扩展合并函数,提升多重假设检验程序的统计功效与效率。
- 提供一种基于数据特征和先验信息选择最优合并方法的系统性方法。
- 利用基于广义均值的合并函数,推广Bonferroni–Holm程序,以在依赖结构下获得更优性能。
提出的方法
- 使用广义均值$M_{r,K}(p_1,\dots,p_K) = \left(\frac{1}{K}\sum_{i=1}^K p_i^r\right)^{1/r}$,其中$r \in [-\infty, \infty]$,包括算术均值($r=1$)、几何均值($r \to 0$)和调和均值($r=-1$)。
- 推导缩放因子$a_{r,K}$,使得$a_{r,K} \cdot M_{r,K}$在任意依赖结构下均为有效合并函数(即产生保守p值)。
- 应用鲁棒风险聚合理论推导精确的缩放因子,证明当$K \to \infty$时,调和均值的缩放因子满足$a_{r,K} \to \ln K$。
- 提出利用辅助信息或先验知识对p值进行加权平均,以提升异质检验场景下的效率。
- 引入一种复合方法(BG方法),结合Bonferroni与几何均值,其在模拟中表现优于单一方法。
- 通过在相关正态检验统计量下进行模拟研究,评估不同依赖程度($\rho = 0.1, 0.5, 0.9$)和样本量($K=50, 400$)下的性能表现。
实验结果
研究问题
- RQ1在$K$个p值的任意依赖结构下,使得$a_{r,K} \cdot M_{r,K}$为有效p值的最小缩放因子$a_{r,K}$是多少?
- RQ2在依赖结构下,基于广义均值的p值合并方法相较于经典方法(如Bonferroni、Fisher)的性能如何?
- RQ3能否通过组合多种方法(如Bonferroni与几何均值)的复合合并函数,实现优于单一方法的统计功效?
- RQ4在不同依赖结构下,为最大化统计功效,广义均值参数$r$的最优选择是什么?
- RQ5如何将先验信息或检验质量纳入基于加权平均的p值合并方法中?
主要发现
- 在$K \to \infty$的渐近意义下,$K$个p值的调和均值可通过$\ln K$进行缩放,从而得到一个有效且保守的p值,优于Bonferroni方法。
- 对于几何均值,$e$作为缩放因子在一般情况下既充分又必要,验证了Mattner的结果。
- 算术均值需通过2进行缩放才能得到有效p值,此结果此前由Rüschendorf和Meng所建立。
- 复合的Bonferroni-几何均值方法($F_{K}^{\mathrm{BG}}$)在所有模拟中均优于基础方法,且对任意$r$的广义均值方法均无支配关系。
- 在强依赖结构下($\rho = 0.9$),几何均值与算术均值方法优于Bonferroni方法及$r < -1$的方法,后者随$K$增大而性能下降。
- 参数$r$的选择显著影响统计功效:$r \approx -1$时因缩放因子急剧膨胀而产生不稳定性,而$r \in [-5, 0]$在模拟中表现出稳定且高效的性能。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。