Skip to main content
QUICK REVIEW

[論文レビュー] Multivariate Ranks and Quantiles using Optimal Transportation and Applications to Goodness-of-fit Testing

Promit Ghosal, Bodhisattva Sen|arXiv (Cornell University)|May 14, 2019
Advanced Statistical Methods and Models参考文献 63被引用数 30
ひとこと要約

本稿は最適輸送理論を用いて多次元順位および分位数の新しい枠組みを導入し、グリヴェンコ=カンテリ型定理を用いて、標本推定の一様一貫性を確立する。この枠組みにより、2標本比較および独立性に関する非パラメトリックな多次元適合度検定が可能となり、分位数写像に関する検証可能な条件下で漸近的一致性が証明される。

ABSTRACT

In this paper we study multivariate ranks and quantiles, defined using the theory of optimal transportation, and build on the work of Chernozhukov et al. (2017) and del Barrio et al. (2018). We study the characterization, computation and properties of the multivariate rank and quantile functions and their empirical counterparts. We derive the uniform consistency of these empirical estimates to their population versions, under certain assumptions. In fact, we prove a Glivenko-Cantelli type theorem that shows the asymptotic stability of the empirical rank map in any direction. We provide easily verifiable sufficient conditions that guarantee the existence of a continuous and invertible population quantile map --- a crucial assumption for our main consistency result. We provide a framework to derive the local uniform rate of convergence of the estimated quantile and ranks functions and explicitly illustrate the technique in a special case. Further, we propose multivariate (nonparametric) goodness-of-fit tests --- a two-sample test and a test for mutual independence --- based on our notion of quantiles and ranks. Asymptotic consistency of these tests are also shown. Additionally, we derive many properties of (sub)-gradients of convex functions and their Legendre-Fenchel duals that may be of independent interest.

研究の動機と目的

  • 最適輸送を用いた理論的裏付けのある多次元順位および分位数の枠組みの構築。
  • 標本順位および分位数写像が母集団対応物に一様に一貫するようにすること。
  • 連続的かつ可逆な母集団分位数写像の存在を保証する検証可能な条件の提供。
  • 2標本比較および相互独立性のための多次元適合度検定の構築。
  • 推定された分位数および順位関数の局所一様収束速度の導出。

提案手法

  • 一様スコアの変換として多次元順位および分位数を最適輸送写像を用いて定義する。
  • 凸関数のレジェンドル=フェンケル双対性を用いて、構成に不可欠な勾配および部分勾配を特徴付ける。
  • グリヴェンコ=カンテリ型定理を適用し、すべての方向にわたる標本順位写像の一様収束を証明する。
  • 凸解析を用いて、母集団分位数写像の連続性および可逆性の十分条件を導出する。
  • 2つの適合度検定を提案する:1つは2標本比較用、もう1つは相互独立性の検定用で、両者とも標本順位に基づく。
  • 特定のパラメトリック族に適用可能な一般枠組みを用いて、局所一様収束速度を確立する。

実験結果

リサーチクエスチョン

  • RQ1最適輸送理論を用いて、どのように多次元順位および分位数を一貫して定義できるか?
  • RQ2母集団分位数写像が存在し、連続的かつ可逆的であるための条件は何か?
  • RQ3標本順位および分位数写像が母集団バージョンに一様収束する速度は何か?
  • RQ4この枠組みを用いて、漸近的一致性を有する非パラメトリックな多次元適合度検定を構築できるか?
  • RQ5この文脈において、部分勾配および凸関数のレジェンドル=フェンケル双対の主な性質は何か?

主な発見

  • 標本順位写像がすべての方向に一様に母集団順位写像に収束し、グリヴェンコ=カンテリ型の結果が確立された。
  • 連続的かつ可逆な母集団分位数写像の存在を保証する十分条件が提示され、一貫性にとって重要である。
  • 推定された分位数および順位関数の局所一様収束速度が導出され、特別な場合では明示的な計算が可能である。
  • 提案された2標本および独立性検定は、帰無仮説および対立仮説の下で漸近的に一貫する。
  • 凸関数の部分勾配およびレジェンドル=フェンケル双対に関する新しい性質が導出され、凸解析において独立の関心を引く可能性がある。
  • この枠組みにより、パラメトリックな分布仮定なしに多次元設定における非パラメトリック推論が可能になる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。