[论文解读] Detecting independence of random vectors II. Distance multivariance and Gaussian multivariance
本文引入了距离多变量相关性(distance multivariance)与总距离多变量相关性(total distance multivariance)作为针对 $ n \geq 2 $ 个随机向量的新型依赖度量,通过使用特征函数的加权 $ L^2 $-距离,将距离协方差推广至多变量设置。其主要贡献是基于连续负定函数导出的距离矩阵,提出了一种针对多个随机向量独立性的、一致且适用于有限样本的检验方法。
We introduce two new measures for the dependence of $n \ge 2$ random variables: `distance multivariance' and `total distance multivariance'. Both measures are based on the weighted $L^2$-distance of quantities related to the characteristic functions of the underlying random variables. They extend distance covariance (introduced by Szekely, Rizzo and Bakirov) and generalized distance covariance (introduced in part I) from pairs of random variables to $n$-tuplets of random variables. We show that total distance multivariance can be used to detect the independence of $n$ random variables and has a simple finite-sample representation in terms of distance matrices of the sample points, where distance is measured by a continuous negative definite function. Based on our theoretical results, we present a test for independence of multiple random vectors which is consistent against all alternatives.
研究动机与目标
- 将距离协方差从两两随机变量扩展至 $ n $-元组随机向量。
- 为 $ n \geq 2 $ 个随机向量的独立性开发一种一致的统计检验方法。
- 利用距离矩阵与连续负定函数,提供依赖度量的有限样本表示形式。
- 为基于特征函数相关量的加权 $ L^2 $-距离在多变量依赖检测中的应用建立理论基础。
提出的方法
- 将距离多变量相关性定义为联合分布与乘积分布的特征函数变换之间的加权 $ L^2 $-距离。
- 引入总距离多变量相关性,即 $ n $-元组所有子集的距离多变量相关性的总和,以捕捉整体依赖结构。
- 使用连续负定函数定义样本点之间的距离度量,从而通过距离矩阵实现有限样本下的计算。
- 基于总距离多变量相关性构造检验统计量,该统计量在独立性条件下收敛于零,在依赖性条件下保持远离零。
- 通过证明该度量在极限下可检测所有形式的依赖,建立检验对所有备择假设的一致性。
- 推导出总距离多变量相关性的有限样本表示形式,其表达式仅依赖于样本点的距离矩阵。
实验结果
研究问题
- RQ1距离协方差能否推广至检测 $ n \geq 2 $ 个随机向量之间的依赖性,而不仅限于两两关系?
- RQ2总距离多变量相关性是否能为 $ n $ 个随机向量的独立性提供一致检验?
- RQ3依赖度量能否通过连续负定函数导出的距离矩阵,以有限样本形式表达?
- RQ4距离多变量相关性的理论基础是什么,其与特征函数及 $ L^2 $-距离的关系如何?
- RQ5与现有多元独立性检验相比,所提出度量的检验效能如何?
主要发现
- 总距离多变量相关性为 $ n $ 个随机向量的独立性提供了一致检验,在任意依赖结构下,原假设的拒绝概率趋近于一。
- 总距离多变量相关性的有限样本表示形式可完全以样本点的距离矩阵表达,其中距离度量由连续负定函数定义。
- 距离多变量相关性将广义距离协方差从两两随机变量推广至 $ n $-元组,能够检测复杂且非线性的依赖关系。
- 该方法在理论基础上建立于特征函数变换的 $ L^2 $-距离,确保对所有形式依赖的敏感性。
- 所提出的检验对所有备择假设均一致,意味着随着样本量增加,可检测出任何与独立性的偏离。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。