Skip to main content
QUICK REVIEW

[论文解读] A Kernel Two-Sample Test for Functional Data

George Wynne, A. Duncan|arXiv (Cornell University)|Aug 25, 2020
Gaussian Processes and Bayesian Inference参考文献 85被引用 32
一句话总结

提出一种基于核的非参数两样本检验,用于比较函数数据的分布,基于在函数空间上的 MMD,同时给出希尔伯特空间上核的理论以及对离散观测的尺度分析。

ABSTRACT

We propose a nonparametric two-sample test procedure based on Maximum Mean Discrepancy (MMD) for testing the hypothesis that two samples of functions have the same underlying distribution, using kernels defined on function spaces. This construction is motivated by a scaling analysis of the efficiency of MMD-based tests for datasets of increasing dimension. Theoretical properties of kernels on function spaces and their associated MMD are established and employed to ascertain the efficacy of the newly proposed test, as well as to assess the effects of using functional reconstructions based on discretised function samples. The theoretical results are demonstrated over a range of synthetic and real world datasets.

研究动机与目标

  • 为来自离散化函数的函数数据的非参数两样本检验提供动机。
  • 将基于核的 MMD 检验推广到实值、可分的希尔伯特空间,以处理函数数据。
  • 建立在函数空间上核具有特征性的条件并描述相关的 RKHS。
  • 分析离散化(网格大小)如何影响检验功效,以及如何通过核带宽的缩放来缓解。
  • 在合成数据和真实数据集上展示理论性质和经验表现。

提出的方法

  • 定义并研究实值、可分希尔伯特空间及其 RKHS 上的核。
  • 引入并使用最大均值差异 (Maximum Mean Discrepancy, MMD) 作为在函数空间上进行两样本检验的统计量。
  • 给出闭式 MMD 表达式以及无偏估计量(U-统计量和线性时间变体)。
  • 分析核带宽随网格大小的尺度化,以在高斯过程上实现与离散化无关的检验功效。
  • 在函数空间上构建并表征平方指数核(SE-T),并推导 RKHS 描述。
  • 讨论使用重构的函数数据的影响,并建立与弱收敛之间的联系。

实验结果

研究问题

  • RQ1在函数空间上的核具特征性需要哪些条件,以确保 MMD 是对函数分布的度量?
  • RQ2离散化(网格大小)如何影响函数数据的核两样本检验的检验功效,以及核尺度缩放是否可以缓解?
  • RQ3如何直接在函数的希尔伯特空间上定义核,以及它们的 RKHS 的结构是怎样的?
  • RQ4在函数数据设定下,MMD 估计量(无偏和线性时间)的渐近分布及功效属性是什么?
  • RQ5高斯过程假设如何有助于推导闭式 MMD 表达式与检验的尺度规律?

主要发现

  • 基于 MMD 的核两样本检验可以在具有特征核的函数空间上构建,从而确保检验有效。
  • 在均值位移的备择下,可以通过适当的带宽缩放使基于 MMD 的检验功效在渐近上与网格大小无关。
  • 开发了一大类实值可分希尔伯特空间上的核,并给出在希尔伯特空间上的平方指数型核(SE-T)的显式 RKHS 表征。
  • 离散化函数数据的重构影响检验结果,理论结果对这些影响进行了量化。
  • 本文提供了理论结果与数值实验,将基于核的检验与现有的函数数据两样本检验进行比较,验证了尺度缩放和有效性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。