Skip to main content
QUICK REVIEW

[论文解读] On the distribution of cross-validated Mahalanobis distances

Jörn Diedrichsen, Serge B. Provost|arXiv (Cornell University)|Jul 5, 2016
Face Recognition and Perception参考文献 26被引用 47
一句话总结

本文推导出交叉验证马氏距离(LDC)的均值与协方差的解析表达式,使其抽样分布可进行多元正态近似。这使得无需依赖计算成本较高的置换检验,即可实现强大且闭式解的统计推断——例如检验距离之间的差异,或直接将整个表示相似性矩阵与计算模型进行比较。

ABSTRACT

We present analytical expressions for the means and covariances of the sample distribution of the cross-validated Mahalanobis distance. This measure has proven to be especially useful in the context of representational similarity analysis (RSA) of neural activity patterns as measured by means of functional magnetic resonance imaging (fMRI). These expressions allow us to construct a normal approximation to the estimated distances, which in turn enables powerful inference on the measured statistics. Using the results, the difference between two distances can be statistically assessed, and the measured structure of the distances can be efficiently compared to predictions from computational models.

研究动机与目标

  • 为基于fMRI的表示相似性分析(RSA)中的交叉验证马氏距离(LDC)提供一种统计上严谨的推断方法。
  • 解决目前缺乏LDC的闭式统计检验的问题,这些检验目前通常依赖计算成本较高的置换检验。
  • 通过提供基于似然的框架,实现LDC与计算模型预测之间的直接比较。
  • 推导LDC抽样分布的准确正态近似,同时考虑信号相关的方差与协方差结构。
  • 通过解析方差表达式,支持对LDC线性对比的可靠推断及模型参数估计。

提出的方法

  • 推导交叉验证马氏距离(LDC)抽样分布的均值与协方差矩阵的解析表达式。
  • 将抽样分布建模为多元正态分布,其均值等于真实距离,协方差矩阵由噪声与信号结构推导得出。
  • 将协方差分解为两部分:一部分来自活动估计中的噪声,另一部分为与信号相关的成分,且随真实距离增加而增大。
  • 对多变量噪声估计器引入正则化(0.2–0.5),以提高方差近似的准确性。
  • 利用正态近似构建LDC线性对比的z检验,实现在无需置换检验情况下的假设检验。
  • 将该近似应用于推导闭式似然函数,用于模型比较,支持通过迭代方法(如迭代加权最小二乘法)进行参数估计。

实验结果

研究问题

  • RQ1我们能否为fMRI数据中交叉验证马氏距离的抽样分布推导出闭式近似?
  • RQ2LDC估计的方差如何依赖于真实距离与噪声结构?
  • RQ3所推导的正态近似能否替代置换检验,用于LDC对比的显著性检验?
  • RQ4如何利用抽样分布将整个表示相似性矩阵与计算模型进行比较?
  • RQ5当体素数量适中(例如 P > 30)时,正态近似是否足够准确以实现可靠的推断?

主要发现

  • 交叉验证马氏距离的抽样分布可被多元正态分布良好近似,其均值与协方差为解析推导所得。
  • LDC估计的方差随真实距离线性增加,且即使真实距离为零时也存在非零截距,因此无法通过简单方差稳定变换消除。
  • LDC估计的协方差矩阵包含噪声引起的与信号相关的两部分成分,且共享共同条件的距离之间(如 i-j 与 i-k)存在依赖关系。
  • 当体素数量超过30,且多变量噪声估计使用0.2至0.5之间的正则化因子时,正态近似具有较高准确性。
  • 基于正态近似的z检验比现有基于t分布的近似更具功效与通用性,后者仅适用于单重交叉验证且忽略协方差结构。
  • 由正态近似导出的闭式似然函数可实现准确的模型比较与参数估计,在模型选择中优于等级相关、皮尔逊相关与余弦夹角。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。