Skip to main content
QUICK REVIEW

[论文解读] A Survey on Multi-View Clustering

Guoqing Chao, Shiliang Sun|arXiv (Cornell University)|Dec 18, 2017
Face and Expression Recognition参考文献 134被引用 119
一句话总结

本综述评估并建立多视图聚类(MVC)的分类法,将生成式方法与判别式方法分开,并详细介绍五类判别式方法、与相关范式的关系、应用以及未解决的问题。

ABSTRACT

With advances in information acquisition technologies, multi-view data become ubiquitous. Multi-view learning has thus become more and more popular in machine learning and data mining fields. Multi-view unsupervised or semi-supervised learning, such as co-training, co-regularization has gained considerable attention. Although recently, multi-view clustering (MVC) methods have been developed rapidly, there has not been a survey to summarize and analyze the current progress. Therefore, this paper reviews the common strategies for combining multiple views of data and based on this summary we propose a novel taxonomy of the MVC approaches. We further discuss the relationships between MVC and multi-view representation, ensemble clustering, multi-task clustering, multi-view supervised and semi-supervised learning. Several representative real-world applications are elaborated. To promote future development of MVC, we envision several open problems that may require further investigation and thorough examination.

研究动机与目标

  • 总结多视图聚类(MVC)及其动机的现状。
  • 提出一个分类法,将 MVC 方法组织为有意义的类别。
  • 讨论 MVC 与相关学习范式之间的关系(例如表示学习、集成聚类、多任务学习)。
  • 突出跨领域的代表性应用并识别未来工作中的开放问题。

提出的方法

  • 将 MVC 方法分为生成式(基于模型)和判别式(基于相似性)两类。
  • 在判别式 MVC 中,进一步按照多视图如何结合分为五类:公共特征向量矩阵、公共系数矩阵、公共指示矩阵、直接视图组合、以及投影后视图组合。
  • 描述代表性技术,如多视图谱聚类、多视图子空间聚类、多视图 NMF、多核聚类,以及基于 CCA 的方法。
  • 解释每一类如何构建并优化目标函数,以在各视图之间实现一致的聚类。
  • 讨论生成式 MVC 中的混合模型与 EM 的使用,并解释 CMMs 和使用跨视图 KL 发散最小化的多视图扩展。

实验结果

研究问题

  • RQ1在 MVC 中有哪些将多个视图结合的主要策略?
  • RQ2MVC 如何被归类为连贯的类别,在每个类别中有哪些代表性方法?
  • RQ3MVC 与相关领域如多视图表示、集成聚类和多任务学习之间的关系是什么?
  • RQ4哪些应用和未解决问题是当前 MVC 领域的特征?

主要发现

  • MVC 方法在很大程度上是判别式的,具有明确的分类法,包括五类视图组合。
  • 生成式 MVC 依赖混合模型和 EM,包括多视图 CMM 扩展,以在不同视图中实现聚类。
  • MVC 与多视图表示、集成聚类、多任务聚类以及多视图有监督/半监督学习之间存在强联系。
  • MVC 已被应用于计算机视觉、自然语言处理、社交多媒体、生物信息学和健康信息学等领域。
  • 该综述指出开放问题,以指导未来的 MVC 发展。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。