[論文レビュー] A Survey on Multi-View Clustering
このサーベイはマルチビュークラスタリング(MVC)手法をレビューし、生成的アプローチと識別的アプローチを分離し、識別的クラスを五つに分類し、関連パラダイムとの関係、応用、および未解決問題を詳述する。
With advances in information acquisition technologies, multi-view data become ubiquitous. Multi-view learning has thus become more and more popular in machine learning and data mining fields. Multi-view unsupervised or semi-supervised learning, such as co-training, co-regularization has gained considerable attention. Although recently, multi-view clustering (MVC) methods have been developed rapidly, there has not been a survey to summarize and analyze the current progress. Therefore, this paper reviews the common strategies for combining multiple views of data and based on this summary we propose a novel taxonomy of the MVC approaches. We further discuss the relationships between MVC and multi-view representation, ensemble clustering, multi-task clustering, multi-view supervised and semi-supervised learning. Several representative real-world applications are elaborated. To promote future development of MVC, we envision several open problems that may require further investigation and thorough examination.
研究の動機と目的
- MVCにおける最新動向とその動機を要約する。
- MVC手法を意味のあるカテゴリーに整理する分類体系を提案する。
- MVCと関連する学習パラダイム(例:表現学習、アンサンブルクラスタリング、マルチタスク学習)との関係を論じる。
- ドメイン横断の代表的な応用を強調し、今後の課題を特定する。
提案手法
- MVC手法を生成的(モデルベース)と識別的(類似度ベース)アプローチに分類する。
- 識別的MVC内では、複数のビューの結合方法に基づいて、共通固有ベクトル行列、共通係数行列、共通指示行列、直接ビュー結合、および射影後のビュー結合の5つのクラスにさらに分類する。
- 多視点スペクトラルクラスタリング、多視点サブスペースクラスタリング、多視点NMF、マルチカーネルクラスタリング、CCAベースの手法などの代表的手法を説明する。
- 各クラスがどのように目的関数を構築・最適化して、ビュー間で一貫したクラスタリングを実現するかを説明する。
- 生成的MVCにおける混合モデルとEMの利用を論じ、KLダイバージェンス最小化を跨ぐCMMsおよびマルチビュー拡張を説明する。
実験結果
リサーチクエスチョン
- RQ1MVCで複数のビューを結合する主な戦略は何か。
- RQ2MVCを一貫したクラスに分類するにはどうすればよく、各クラスの代表的手法は何か。
- RQ3MVCと多視点表現学習、アンサンブルクラスタリング、マルチタスク学習などの関連領域との関係は何か。
- RQ4現在のMVCの状況を特徴づける応用と未解決問題は何か。
主な発見
- MVC手法は大半が識別的で、ビュー結合の5つのクラスを含む明確な分類体系がある。
- 生成的MVCは混合モデルとEMに依存し、マルチビューCMM拡張を含めてビュー間クラスタリングを達成する。
- MVCと多視点表現、アンサンブルクラスタリング、マルチタスククラスタリング、マルチビュー教師あり/半教師あり学習との強い関連がある。
- MVCはコンピュータビジョン、自然言語処理、ソーシャルマルチメディア、バイオインフォマティクス、ヘルスインフォマティクスなどの分野で適用されてきた。
- 本調査は将来のMVC開発を指針とする未解決問題を特定している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。