Skip to main content
QUICK REVIEW

[論文レビュー] A Kernel Independence Test for Random Processes

Kacper Chwialkowski, Arthur Gretton|arXiv (Cornell University)|Feb 18, 2014
Statistical Methods and Inference参考文献 34被引用数 22
ひとこと要約

本稿では、時系列データの系列依存性を保つためにブートストラップリサンプリングの代わりに時系列シフトを用いることで、i.i.d. ハイプスティック・シュミット独立性基準(HSIC)テストを非パラメトリックな時間過程への応用に適応させた、非パラメトリックなカーネル独立性検定を提案する。この手法は、型Iエラー率を適切に制御し、線形手法では検出できない非線形依存性を検出でき、人工データおよび為替レートデータを用いた実証的検証により、ブートストラップに基づく手法よりも優れた性能を示した。

ABSTRACT

A new non parametric approach to the problem of testing the independence of two random process is developed. The test statistic is the Hilbert Schmidt Independence Criterion (HSIC), which was used previously in testing independence for i.i.d pairs of variables. The asymptotic behaviour of HSIC is established when computed from samples drawn from random processes. It is shown that earlier bootstrap procedures which worked in the i.i.d. case will fail for random processes, and an alternative consistent estimate of the p-values is proposed. Tests on artificial data and real-world Forex data indicate that the new test procedure discovers dependence which is missed by linear approaches, while the earlier bootstrap procedure returns an elevated number of false positives. The code is available online: https://github.com/kacperChwialkowski/HSIC .

研究の動機と目的

  • パラメトリックモデルや密度推定を仮定せずに、二つの確率過程の瞬時の依存性を一貫して非パラメトリックに検定すること。
  • 時系列における系列依存性のため、標準的なブートストラップ手順が失敗し、型Iエラー率が上昇することを是正すること。
  • 順列に基づくブートストラップを避ける代わりに、信号シフトを用いることで、系列依存性下でのHSICの正しい帰無分布推定を提供すること。
  • 線形相関や従来のi.i.d. テストでは検出できない時系列における非線形依存性を検出すること。
  • 系列依存性下でも名目水準(例:α = 0.05)を維持し、誤検出(偽陽性)を回避すること。

提案手法

  • 検定は、時刻tにおける二つの確率過程X_tとY_t間の非パラメトリックな依存性測度として、ヒルバート=シュミット独立性基準(HSIC)を用いる。
  • 帰無仮説は、各時刻でX_tとY_tが独立であると仮定するが、対立仮説は任意の形の依存性を許容する。
  • 時系列におけるHSICの漸近的帰無分布は、相関のあるχ²変数の重み付き和として導出され、i.i.d. の場合とは異なり、独立なχ²変数とは異なる。
  • 本稿では、各過程の内部的系列依存構造を保つために、一方の信号を他方に対して時系列シフトする、新しいリサンプリング手順を提案する。
  • 順列に基づくブートストラップを避けることで、系列依存性が破壊され、時系列では型Iエラー率が上昇するのを防ぐ。
  • 理論的分析により、帰無仮説下でHSICは、相関のある固有値を持つスケーリングされたχ²変数の和に収束し、対立仮説下では漸近的に正規分布に従うことが示された。

実験結果

リサーチクエスチョン

  • RQ1i.i.d. データに用いられる標準的なブートストラップ手順を、時系列の独立性検定に信頼性を持って適用できるか?
  • RQ2提案されたシフトリサンプリング法は、系列依存性下でも正しい型Iエラー率(α = 0.05)を維持できるか?
  • RQ3HSICは、線形相関や従来のi.i.d. テストでは検出できない時系列における非線形依存性を検出できるか?
  • RQ4定常的で弱い系列依存性を示す確率過程にHSICを適用した際の漸近的分布は何か?
  • RQ5実世界の為替時系列データにおいて、新規の検定手法はブートストラップに基づく手法と比較してどのように性能を発揮するか?

主な発見

  • i.i.d. 環境で用いられるブートストラップ手順は、時系列では失敗し、系列依存性が破壊されることで、誤検出率(偽陽性)が上昇する。
  • 提案されたシフトリサンプリング法は、強い系列依存性下でも名目水準の型Iエラー率(α = 0.05)を適切に維持できた。
  • 人工データにおいて、線形相関では検出できない非線形依存性を検出でき、複雑な依存構造への感受性を示した。
  • 実世界の為替データでは、線形アプローチでは検出できない依存性を同定でき、実用的有効性を確認した。
  • 時系列におけるHSICの漸近的帰無分布は、相関のあるχ²変数の重み付き和であり、独立な場合とは異なる。
  • 対立仮説下で、検定統計量は漸近的に正規分布に従い、一貫した推論が可能である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。