[论文解读] Multivariate Ranks and Quantiles using Optimal Transportation and Applications to Goodness-of-fit Testing
本文提出了一种基于最优传输理论的多元秩与分位数的新框架,通过类似Glivenko-Cantelli的定理建立了经验估计的统一一致性。该方法实现了对两样本比较和独立性检验的非参数多元拟合优度检验,且在可验证的分位数映射条件下证明了渐近一致性。
In this paper we study multivariate ranks and quantiles, defined using the theory of optimal transportation, and build on the work of Chernozhukov et al. (2017) and del Barrio et al. (2018). We study the characterization, computation and properties of the multivariate rank and quantile functions and their empirical counterparts. We derive the uniform consistency of these empirical estimates to their population versions, under certain assumptions. In fact, we prove a Glivenko-Cantelli type theorem that shows the asymptotic stability of the empirical rank map in any direction. We provide easily verifiable sufficient conditions that guarantee the existence of a continuous and invertible population quantile map --- a crucial assumption for our main consistency result. We provide a framework to derive the local uniform rate of convergence of the estimated quantile and ranks functions and explicitly illustrate the technique in a special case. Further, we propose multivariate (nonparametric) goodness-of-fit tests --- a two-sample test and a test for mutual independence --- based on our notion of quantiles and ranks. Asymptotic consistency of these tests are also shown. Additionally, we derive many properties of (sub)-gradients of convex functions and their Legendre-Fenchel duals that may be of independent interest.
研究动机与目标
- 利用最优传输理论,构建一个理论基础坚实的多元秩与分位数框架。
- 建立经验秩与分位数映射相对于其总体对应物的统一一致性。
- 提供可验证的条件,以确保总体分位数映射的连续性与可逆性。
- 构建用于两样本比较与相互独立性检验的多元拟合优度检验。
- 推导估计分位数与秩函数的局部一致收敛速率。
提出的方法
- 利用最优传输映射,将多元秩与分位数定义为均匀得分的变换。
- 利用凸函数的Legendre-Fenchel对偶性,刻画梯度与次梯度,这些是构造过程中的关键要素。
- 应用类似Glivenko-Cantelli的定理,证明经验秩映射在所有方向上的统一收敛性。
- 利用凸分析推导出总体分位数映射连续性与可逆性的充分条件。
- 提出两种拟合优度检验:一种用于两样本比较,另一种用于检验相互独立性,两者均基于经验秩。
- 通过一个适用于特定参数族的一般框架,建立局部一致收敛速率。
实验结果
研究问题
- RQ1如何利用最优传输理论一致地定义多元秩与分位数?
- RQ2在何种条件下,总体分位数映射存在且保持连续与可逆?
- RQ3经验秩与分位数映射相对于其总体版本的统一收敛速率是多少?
- RQ4能否基于此框架构建渐近一致的非参数多元拟合优度检验?
- RQ5在此背景下,凸函数的次梯度与Legendre-Fenchel对偶的哪些性质是关键的?
主要发现
- 经验秩映射在所有方向上一致收敛于总体秩映射,建立了类似Glivenko-Cantelli的结果。
- 提供了确保总体分位数映射连续且可逆的充分条件,这对一致性至关重要。
- 推导出估计分位数与秩函数的局部一致收敛速率,并在特定情况下给出了显式计算。
- 所提出的两样本检验与独立性检验在原假设与备择假设下均具有渐近一致性。
- 推导出凸函数次梯度与Legendre-Fenchel对偶的新性质,这些性质在凸分析中可能具有独立兴趣。
- 该框架使得在无需参数分布假设的前提下,实现多元设定下的非参数推断。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。