Skip to main content
QUICK REVIEW

[论文解读] A Kernel Independence Test for Random Processes

Kacper Chwialkowski, Arthur Gretton|arXiv (Cornell University)|Feb 18, 2014
Statistical Methods and Inference参考文献 34被引用 22
一句话总结

本文提出了一种基于希尔伯特-施мид特独立性准则(HSIC)的非参数核独立性检验方法,用于随机过程。该方法通过用时间移位替代自助抽样,将i.i.d.情形下的HSIC检验适配于时间序列,以保持序列依赖性。该方法确保了第一类错误率的有效控制,并能检测出线性方法所遗漏的非线性依赖关系。在人工数据和外汇数据上的实证验证表明,该方法在性能上优于基于自助抽样的方法。

ABSTRACT

A new non parametric approach to the problem of testing the independence of two random process is developed. The test statistic is the Hilbert Schmidt Independence Criterion (HSIC), which was used previously in testing independence for i.i.d pairs of variables. The asymptotic behaviour of HSIC is established when computed from samples drawn from random processes. It is shown that earlier bootstrap procedures which worked in the i.i.d. case will fail for random processes, and an alternative consistent estimate of the p-values is proposed. Tests on artificial data and real-world Forex data indicate that the new test procedure discovers dependence which is missed by linear approaches, while the earlier bootstrap procedure returns an elevated number of false positives. The code is available online: https://github.com/kacperChwialkowski/HSIC .

研究动机与目标

  • 开发一种一致的、非参数的检验方法,用于检测两个随机过程在瞬时时刻的依赖关系,而无需假设参数模型或密度估计。
  • 解决标准自助抽样程序在时间序列中失效的问题,因为时间依赖性会导致第一类错误率升高。
  • 通过使用信号移位而非置换,为时间序列中HSIC的零分布提供有效的估计。
  • 检测出线性相关性或传统i.i.d.检验所遗漏的时间序列中的非线性依赖关系。
  • 确保在时间依赖性存在的情况下,检验能保持名义显著性水平(例如α = 0.05),避免出现假阳性结果。

提出的方法

  • 该检验使用希尔伯特-施米特独立性准则(HSIC)作为两个随机过程X_t和Y_t在时间t处依赖关系的非参数度量。
  • 零假设假设X_t和Y_t在每个时间点上是独立的,而备择假设允许任何形式的依赖。
  • 推导出时间序列中HSIC的渐近零分布为一组相关χ²变量的加权和,这与i.i.d.情形下独立χ²变量的情况不同。
  • 提出一种新颖的重抽样程序:将一个信号相对于另一个信号进行移位,以保持每个过程内部的时间依赖结构。
  • 该方法避免使用基于置换的自助抽样,因为后者会破坏时间依赖性,导致时间序列中第一类错误率升高。
  • 理论分析表明,在零假设下,HSIC收敛于一组具有相关特征值的缩放χ²变量之和;在备择假设下,其渐近分布为正态分布。

实验结果

研究问题

  • RQ1能否将i.i.d.数据中使用的标准自助抽样程序可靠地应用于时间序列的独立性检验?
  • RQ2所提出的移位重抽样方法在时间依赖性存在时是否能保持正确的第一类错误率?
  • RQ3HSIC能否检测出线性相关性或传统i.i.d.检验所无法识别的时间序列中的非线性依赖关系?
  • RQ4当应用于平稳、弱依赖的随机过程时,HSIC的渐近分布是什么?
  • RQ5该新检验方法在真实世界金融时间序列上的表现与基于自助抽样的方法相比如何?

主要发现

  • i.i.d.情形下使用的自助抽样程序在时间序列中失效,由于时间依赖性被破坏,导致假阳性率升高。
  • 所提出的移位重抽样方法在强时间依赖性下仍能成功维持名义第一类错误率(α = 0.05)。
  • 该检验能检测出人工数据中线性相关性所缺失的非线性依赖关系,显示出对复杂依赖结构的敏感性。
  • 在真实世界外汇数据上,该方法识别出了线性方法所遗漏的依赖关系,证实了其实际应用价值。
  • 时间序列中HSIC的渐近零分布为一组相关χ²变量的加权和,与独立情形不同。
  • 在备择假设下,检验统计量渐近服从正态分布,从而支持一致推断。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。