Skip to main content
QUICK REVIEW

[论文解读] Sliced Wasserstein Kernel for Persistence Diagrams

Mathieu Carrière, Marco Cuturi|arXiv (Cornell University)|Jun 11, 2017
Topological and Geometric Data Analysis参考文献 33被引用 87
一句话总结

引入一种用于持久性图的切片 Wasserstein 核,具有可证明的稳定性和辨识性,并提供高效近似,在基准测试中的分类性能优于现有核。

ABSTRACT

Persistence diagrams (PDs) play a key role in topological data analysis (TDA), in which they are routinely used to describe topological properties of complicated shapes. PDs enjoy strong stability properties and have proven their utility in various learning contexts. They do not, however, live in a space naturally endowed with a Hilbert structure and are usually compared with specific distances, such as the bottleneck distance. To incorporate PDs in a learning pipeline, several kernels have been proposed for PDs with a strong emphasis on the stability of the RKHS distance w.r.t. perturbations of the PDs. In this article, we use the Sliced Wasserstein approximation SW of the Wasserstein distance to define a new kernel for PDs, which is not only provably stable but also provably discriminative (depending on the number of points in the PDs) w.r.t. the Wasserstein distance $d_1$ between PDs. We also demonstrate its practicality, by developing an approximation technique to reduce kernel computation time, and show that our proposal compares favorably to existing kernels for PDs on several benchmarks.

研究动机与目标

  • 在学习中动机使用持久性图,并解决传统图缺乏希尔伯特空间结构的问题。
  • 提出基于切片 Wasserstein 距离的核,将持久性图注入 RKHS,并具备稳定性和辨识性。
  • 建立 SW 与图距离 d1 的理论保证,并展示实际计算方法。
  • 将所提核与现有核在基准分类任务上进行比较,并展示性能提升。

提出的方法

  • 将切片 Wasserstein(SW)距离定义为将图投影到通过原点的直线上,对这些投影上的最优传输在所有方向上进行积分。
  • 证明 SW 是条件负定的,因此定义正定核 k_SW(x,y)=exp(-SW(x,y)/(2 sigma^2))。
  • 证明稳定性:SW 被图之间的 d1 的某个倍数所界定。
  • 证明辨识性:对有界基数的图,SW 可以在一个因子内从下界界出 d1。
  • 给出一种高效近似算法,采样方向以在 O(M N log N) 时间内计算 SW,对有界基数的情况有精确变体。
  • 演示 SW 特征映射在有限、受限图上的可单射性,并通过指数化讨论 universality。

实验结果

研究问题

  • RQ1持久性图的核能否在相对于图距离方面同时具备稳定性和辨识性?
  • RQ2切片 Wasserstein 距离是否提供一个实用、可计算的替代量,在核方法中使用时保留持久性图的几何结构?
  • RQ3k_SW 与现有核(PSS、PWG)在分类任务和计算成本方面的比较如何?
  • RQ4是否存在一种高效的近似方案,在加速计算的同时保持核性质?

主要发现

  • SW 是一个相对于第一图距离 d1 的稳定且具辨识性的持久性图核。
  • SW 在其诱导的 RKHS 距离上与 d1 具有强等价性,直到单调、连续的扭曲,从而实现几何保留的嵌入。
  • 使用 M 个采样方向的高效近似(SW_M)在减少计算时间的同时提供具有竞争力的准确性。
  • 实证基准显示 k_SW 在若干任务上优于 k_PSS 和 k_PWG(Orbit, Texture, Human, Airplane, Ant, Bird, FourLeg, Octopus, Fish)。
  • 论文提供精确和近似计算方案,通用位置图的精确时间为 O(N^2 log N),近似为 O(M N log N)。
  • 实验表明少量方向就足以获得良好的分类性能。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。