Skip to main content
QUICK REVIEW

[論文レビュー] Statistical Analysis and Parameter Selection for Mapper

Mathieu Carrière, Bertrand Michel|arXiv (Cornell University)|Jun 1, 2017
Topological and Geometric Data Analysis参考文献 27被引用数 59
ひとこと要約

Mapper は Reeb グラフへ収束することが示され、最適推定量であり、トポロジー特徴の自動パラメータ調整と信頼区間を可能にします。

ABSTRACT

In this article, we study the question of the statistical convergence of the 1-dimensional Mapper to its continuous analogue, the Reeb graph. We show that the Mapper is an optimal estimator of the Reeb graph, which gives, as a byproduct, a method to automatically tune its parameters and compute confidence regions on its topological features, such as its loops and flares. This allows to circumvent the issue of testing a large grid of parameters and keeping the most stable ones in the brute-force setting, which is widely used in visualization, clustering and feature selection with the Mapper.

研究の動機と目的

  • 教師なし学習と可視化のためのトポロジーデータ解析ツールとして Mapper の利用を動機づける。
  • Mapper と連続的な Reeb グラフとを結ぶ統計的収束フレームワークを確立する。
  • フィルターの正則性とデータの標準性に基づくパラメータ選択の指針と収束速度を導出する。
  • Loop や flare などの Mapper トポロジー特徴の信頼区間を構築する方法を提供する。

提案手法

  • 定義 Mapper は特定の 1-スケルトン(Rips)とフィルター範囲の規則的なカバーを用い、長さ r が固定の区間と重なり g が固定の区間を用いる。
  • 拡張持続図と持続度量 dΔ を用いて Mapper 出力と Reeb グラフを比較する。
  • 到達性/凸性の仮定とフィルター f の連続性のモジュラス ω の下で dΔ(R_f(X), M_n) を r + 2ω(δ) で境界付ける近似不等式を証明する。
  • n が大きくなるにつれて Mapper のミニマックス収束率を、標準性パラメータ (a, b) と f の連続性のモジュラスに依存して導出する。
  • 既知の生成モデルを持つ厳密なフィルターと、推定されたフィルター(推定器)という二つの設定を説明し、それぞれのリスク境界を示す。
  • 未知の生成パラメータを扱うための系外推論と安定性結果を提示する。

実験結果

リサーチクエスチョン

  • RQ1Morse型フィルターの下で Mapper は空間の Reeb グラフを一貫して近似しますか。
  • RQ2フィルターの正則性とデータ分布の下で、サンプルサイズが増加するにつれて Mapper が Reeb グラフへ収束する速度はどのようなものですか。
  • RQ3推定誤差を最適化しアーティファクトを避けるために Mapper のパラメータ(r, g, δ)をどのように選択すべきですか。
  • RQ4拡張持続を用いて Mapper のトポロジー特徴(ループ、flare)の信頼区間をどう計算できますか。
  • RQ5厳密フィルター設定と推定フィルター設定は、推定リスクと実践的なパラメータ調整の観点からどう比較されますか。

主な発見

  • 特定のパラメータ選択を行った Mapper は dΔ(R_f(X), M_n) ≤ r + 2ω(δ) を満たし、具体的な近似境界を提供します。
  • Mapper の Reeb グラフへの収束速度はフィルターの連続性のモジュラス ω およびデータ次元パラメータ b に比例しており、対数因子を除けばミニマックス最適性を達成します。
  • 標準性仮定 (a, b) およびリプシッツ性または凹形のモジュラスの連続性の下で、Mapper は関連する集合推定問題の既知の収束速度と同程度を達成します。
  • 系外の推論のコロラリ―はフィルター推定誤差に対する頑健性を示し、推定器のずれ ω(δ) とサンプル由来のずれを含む境界を含みます。
  • 未知の生成パラメータを扱う際のサブサンプリング戦略により、パラメータ調整を可能にし、収束保証を保持します。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。