Skip to main content
QUICK REVIEW

[論文レビュー] A Uniqueness Theorem for Clustering

Reza Bosagh Zadeh, Shai Ben-David|arXiv (Cornell University)|May 9, 2012
Advanced Clustering Algorithms Research参考文献 6被引用数 85
ひとこと要約

この論文は、クラスタリングのための新しい公理的枠組みを提案する。これは、クラインバーグの不可能性結果を回避するために、彼の公理の一つを緩和することで、一貫性のある公理的セットを可能にする。この研究では、単一連結クラスタリング(Single-Linkage)が特定の抽象的性質を満たす唯一の関数であることを示す一意性定理を確立し、その使用に理論的根拠を与え、クラスタリングパラダイムの分類法の基盤を形成する。

ABSTRACT

Despite the widespread use of Clustering, there is distressingly little general theory of clustering available. Questions like "What distinguishes a clustering of data from other data partitioning?", "Are there any principles governing all clustering paradigms?", "How should a user choose an appropriate clustering algorithm for a particular task?", etc. are almost completely unanswered by the existing body of clustering literature. We consider an axiomatic approach to the theory of Clustering. We adopt the framework of Kleinberg, [Kle03]. By relaxing one of Kleinberg's clustering axioms, we sidestep his impossibility result and arrive at a consistent set of axioms. We suggest to extend these axioms, aiming to provide an axiomatic taxonomy of clustering paradigms. Such a taxonomy should provide users some guidance concerning the choice of the appropriate clustering paradigm for a given task. The main result of this paper is a set of abstract properties that characterize the Single-Linkage clustering function. This characterization result provides new insight into the properties of desired data groupings that make Single-Linkage the appropriate choice. We conclude by considering a taxonomy of clustering functions based on abstract properties that each satisfies.

研究の動機と目的

  • クラスタリングが広範に使用されているにもかかわらず、一般の理論的基盤が欠如しているという問題に対処すること。
  • クラインバーグの不可能性結果を、彼の公理の一つを緩和することで解決し、一貫性のある公理的体系を可能にすること。
  • 異なるクラスタリングパラダイムを区別する抽象的性質に基づいて、クラスタリング関数の分類法を開発すること。
  • 単一連結クラスタリングを、抽象的で望ましい性質の集合によって特徴づけ、特定の文脈におけるその使用に理論的根拠を与えること。
  • データの特性と望ましいグループ化行動に基づいて、適切なクラスタリングアルゴリズムを選択するための原則的指針を提供すること。

提案手法

  • クラインバーグの公理的枠組みを採用するが、「スケール不変性」の公理を緩和して不可能性結果を回避すること。
  • 一貫性、豊かさ、および修正された不変性性質を含む、新しい公理のセットを定義し、整合性を保証すること。
  • 提案されたすべての公理を満たす唯一のクラスタリング関数=単一連結クラスタリングを同定すること。
  • 抽象的数学的性質を用いてクラスタリング関数の挙動を特徴づけ、接続性とリンクルールに焦点を当てる。
  • 緩和された枠組み下で、唯一の単一連結クラスタリング関数がすべての公理を満たすことを形式的証明すること。
  • 各関数が満たす抽象的性質に基づいて、クラスタリング関数の分類法を提唱すること。

実験結果

リサーチクエスチョン

  • RQ1どの抽象的性質が単一連結クラスタリング関数を一意に特徴づけるか?
  • RQ2クラインバーグの不可能性結果にもかかわらず、クラスタリングの公理的枠組みをどのように一貫性を持たせられるか?
  • RQ3どのクラスタリングパラダイムがどの抽象的性質の集合を満たし、それがアルゴリズム選択にどのように寄与できるか?
  • RQ4理論的に厳密に、クラスタリングと任意のデータ分割とは何が異なるのか?
  • RQ5共通の抽象的性質に基づいて、統一されたクラスタリング関数の分類法を構築できるか?

主な発見

  • 単一連結クラスタリングは、一貫性、豊かさ、および緩和された不変性条件を含む、提案された公理の集合を満たす唯一のクラスタリング関数である。
  • クラインバーグのスケール不変性公理の緩和により、一意なクラスタリング関数が存在する一貫性のある公理的枠組みが可能になった。
  • 公理的特徴づけにより、接続性と階層的グループ化を重視する状況において単一連結クラスタリングを使用する理論的根拠が得られた。
  • この枠組みは、各関数が満たす抽象的性質に基づいてクラスタリング関数の分類法の構築を支援する。
  • 結果として、望ましいデータグループ化行動に基づいてクラスタリングアルゴリズムを選択するための原則的根拠が得られた。
  • 一意性定理により、緩和された枠組み下で、唯一の単一連結クラスタリング関数が提案された公理の全セットを満たすことが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。