Skip to main content
QUICK REVIEW

[論文レビュー] Sliced Wasserstein Kernel for Persistence Diagrams

Mathieu Carrière, Marco Cuturi|arXiv (Cornell University)|Jun 11, 2017
Topological and Geometric Data Analysis参考文献 33被引用数 87
ひとこと要約

Persistence diagrams のための Sliced Wasserstein カーネルを導入。安定性と識別性が証明可能で、効率的な近似も提供され、従来のカーネルと比較してベンチマークで優れた分類性能を示す。

ABSTRACT

Persistence diagrams (PDs) play a key role in topological data analysis (TDA), in which they are routinely used to describe topological properties of complicated shapes. PDs enjoy strong stability properties and have proven their utility in various learning contexts. They do not, however, live in a space naturally endowed with a Hilbert structure and are usually compared with specific distances, such as the bottleneck distance. To incorporate PDs in a learning pipeline, several kernels have been proposed for PDs with a strong emphasis on the stability of the RKHS distance w.r.t. perturbations of the PDs. In this article, we use the Sliced Wasserstein approximation SW of the Wasserstein distance to define a new kernel for PDs, which is not only provably stable but also provably discriminative (depending on the number of points in the PDs) w.r.t. the Wasserstein distance $d_1$ between PDs. We also demonstrate its practicality, by developing an approximation technique to reduce kernel computation time, and show that our proposal compares favorably to existing kernels for PDs on several benchmarks.

研究の動機と目的

  • 学習における持続図(persistence diagrams)の利用を動機付け、標準の図形に対するヒルベルト空間構造の欠如を解決する。
  • 持続図を RKHS に安定性と識別性を持って注入するため、Sliced Wasserstein 距離に基づくカーネルを提案する。
  • SW と図の距離 d1 との理論的保証を確立し、実用的な計算手法を示す。
  • 提案カーネルを既存カーネルとベンチマーク分類タスクで比較し、性能の向上を示す。

提案手法

  • Sliced Wasserstein (SW) 距離を、図を原点を通る直線に射影し、これらの射影に対する最適輸送を全方向にわたって積分して定義する。
  • SW は条件付き負決定性を満たすことを示し、k_SW(x,y)=exp(-SW(x,y)/(2 sigma^2)) の正定核を定義する。
  • 安定性を証明する:SW は図間の距離 d1 の整数倍で適応的に上界される。
  • 識別性を証明する:SW は有界次数(集合の基数が有界)を持つ場合、下向きの係数で d1 を下から境界づける。
  • SW を O(M N log N) 時間で計算する方向をサンプリングする効率的近似アルゴリズムを提供し、基数が有界な場合の正確なバリアントも提供する。
  • 有限で有界な図形に対する SW の特徴写像の射像の単射性を示し、指数化を通じた普遍性について議論する。

実験結果

リサーチクエスチョン

  • RQ1持続図のカーネルは、図の距離に対して安定性と識別性を両立できるか。
  • RQ2Sliced Wasserstein 距離は、カーネル法で用いられるとき、持続図の幾何を保持する実用的な近似 surrogate を提供するか。
  • RQ3k_SW は既存のカーネル(PSS、PWG)と分類タスクおよび計算コストの点でどう比較されるか。
  • RQ4計算を高速化しつつ、カーネル性を維持する効率的な近似手法は存在するか。

主な発見

  • SW は第一図の距離 d1 に対して安定で識別的な Persistence Diagrams のカーネルである。
  • SW は導かれる RKHS における距離が、単調で連続な歪みの下で d1 に強く等価であり、幾何学を保つ埋め込みを可能にする。
  • M 個のサンプル方向を用いる効率的近似 (SW_M) は、計算時間を抑えつつ競争力のある精度を提供する。
  • 実験ベンチマークにより k_SW は複数のタスク(Orbit, Texture, Human, Airplane, Ant, Bird, FourLeg, Octopus, Fish)で k_PSS および k_PWG を上回る。
  • 一般位置の図形に対して正確な O(N^2 log N) 時間の計算と、近似の O(M N log N) を含む、正確および近似計算スキームを提供する。
  • 実験から、良好な分類性能には少数の方向で十分であることが示される。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。