Skip to main content
QUICK REVIEW

[论文解读] Power of Change-Point Tests for Long-Range Dependent Data

Herold Dehling, Aeneas Rooch|arXiv (Cornell University)|Mar 4, 2013
Statistical Methods and Inference参考文献 2被引用 9
一句话总结

本文分析了CUSUM检验与Wilcoxon变点检验在长程依赖(LRD)数据下的统计功效,推导了其在局部替代假设下的渐近功效的解析公式。主要发现是,对于高斯LRD数据,Wilcoxon检验相对于CUSUM检验的渐近相对效率(ARE)为1,与经典i.i.d.情形下ARE = 3/π的结果相矛盾,表明在LRD高斯设定下尽管Wilcoxon检验对异常值具有稳健性,但其效率与CUSUM检验相当。

ABSTRACT

We investigate the power of the CUSUM test and the Wilcoxon change-point test for a shift in the mean of a process with long-range dependent noise. We derive analytiv formulas for the power of these tests under local alternatives. These results enable us to calculate the asymptotic relative efficiency (ARE) of the CUSUM test and the Wilcoxon change point test. We obtain the surprising result that for Gaussian data, the ARE of these two tests equals 1, in contrast to the case of i.i.d. noise when the ARE is known to be $3/π$.

研究动机与目标

  • 研究长程依赖(LRD)数据在局部替代假设下CUSUM与Wilcoxon变点检验的统计功效。
  • 推导这些检验在局部替代假设下的渐近功效的解析公式。
  • 计算Wilcoxon检验相对于CUSUM检验在LRD数据下的渐近相对效率(ARE)。
  • 解释为何在高斯LRD数据下ARE等于1,与经典i.i.d.情形下已知的3/π结果相反。
  • 通过模拟研究验证理论发现,涵盖高斯与重尾(Pareto)LRD数据。

提出的方法

  • 使用LRD创新过程的Hermite展开,将检验统计量表示为Hermite多项式的形式。
  • 利用函数极限定理,推导CUSUM与Wilcoxon检验统计量在局部替代假设下的渐近分布。
  • 应用局部替代概念,其中均值偏移hn随样本量n减小,使得检验功效收敛到非退化极限。
  • 将渐近相对效率(ARE)定义为达到相同检验功效所需样本量之比的极限。
  • 通过10,000次蒙特卡洛模拟验证理论功效计算结果,涵盖多种断点位置与偏移大小。
  • 在重尾数据下,使用经验5%分位数作为CUSUM检验的临界值,以确保检验大小正确,因为渐近临界值收敛过慢。

实验结果

研究问题

  • RQ1对于长程依赖高斯数据,CUSUM检验在局部替代假设下的渐近功效是多少?
  • RQ2对于长程依赖数据,Wilcoxon变点检验在局部替代假设下的渐近功效是多少?
  • RQ3对于长程依赖高斯数据,Wilcoxon检验相对于CUSUM检验的渐近相对效率(ARE)是多少?
  • RQ4为何在LRD高斯数据下ARE等于1,与经典i.i.d.情形下已知的3/π相反?
  • RQ5在重尾LRD数据下,这些检验的表现如何?理论ARE预测在有限样本中是否成立?

主要发现

  • 对于长程依赖高斯数据,Wilcoxon变点检验相对于CUSUM检验的渐近相对效率(ARE)恰好为1,表明两者效率相等。
  • 该结果出人意料,因为在i.i.d.情形下,ARE已知为3/π ≈ 0.955,表明CUSUM检验更高效。
  • 在重尾(Pareto(3,1))LRD数据下,理论ARE预测约为26.655,表明CUSUM检验需约26.66倍于Wilcoxon检验的样本量才能达到相同功效。
  • 模拟结果证实,对于固定跳跃位置τ,当CUSUM检验样本量nC ≈ 26.66 × nW而Wilcoxon检验样本量为nW时,两者的功效近似相等,验证了理论ARE预测。
  • 在重尾数据下,CUSUM检验收敛到其渐近零分布的速度较慢,因此在模拟中需使用有限样本的经验分位数以保持正确的检验大小。
  • 对于高斯LRD数据,模拟结果显示,无论断点位置或偏移大小如何,两种检验的功效均非常接近,支持理论上的ARE = 1结论。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。