[论文解读] A Survey on Multi-View Clustering
本综述评估并建立多视图聚类(MVC)的分类法,将生成式方法与判别式方法分开,并详细介绍五类判别式方法、与相关范式的关系、应用以及未解决的问题。
With advances in information acquisition technologies, multi-view data become ubiquitous. Multi-view learning has thus become more and more popular in machine learning and data mining fields. Multi-view unsupervised or semi-supervised learning, such as co-training, co-regularization has gained considerable attention. Although recently, multi-view clustering (MVC) methods have been developed rapidly, there has not been a survey to summarize and analyze the current progress. Therefore, this paper reviews the common strategies for combining multiple views of data and based on this summary we propose a novel taxonomy of the MVC approaches. We further discuss the relationships between MVC and multi-view representation, ensemble clustering, multi-task clustering, multi-view supervised and semi-supervised learning. Several representative real-world applications are elaborated. To promote future development of MVC, we envision several open problems that may require further investigation and thorough examination.
研究动机与目标
- 总结多视图聚类(MVC)及其动机的现状。
- 提出一个分类法,将 MVC 方法组织为有意义的类别。
- 讨论 MVC 与相关学习范式之间的关系(例如表示学习、集成聚类、多任务学习)。
- 突出跨领域的代表性应用并识别未来工作中的开放问题。
提出的方法
- 将 MVC 方法分为生成式(基于模型)和判别式(基于相似性)两类。
- 在判别式 MVC 中,进一步按照多视图如何结合分为五类:公共特征向量矩阵、公共系数矩阵、公共指示矩阵、直接视图组合、以及投影后视图组合。
- 描述代表性技术,如多视图谱聚类、多视图子空间聚类、多视图 NMF、多核聚类,以及基于 CCA 的方法。
- 解释每一类如何构建并优化目标函数,以在各视图之间实现一致的聚类。
- 讨论生成式 MVC 中的混合模型与 EM 的使用,并解释 CMMs 和使用跨视图 KL 发散最小化的多视图扩展。
实验结果
研究问题
- RQ1在 MVC 中有哪些将多个视图结合的主要策略?
- RQ2MVC 如何被归类为连贯的类别,在每个类别中有哪些代表性方法?
- RQ3MVC 与相关领域如多视图表示、集成聚类和多任务学习之间的关系是什么?
- RQ4哪些应用和未解决问题是当前 MVC 领域的特征?
主要发现
- MVC 方法在很大程度上是判别式的,具有明确的分类法,包括五类视图组合。
- 生成式 MVC 依赖混合模型和 EM,包括多视图 CMM 扩展,以在不同视图中实现聚类。
- MVC 与多视图表示、集成聚类、多任务聚类以及多视图有监督/半监督学习之间存在强联系。
- MVC 已被应用于计算机视觉、自然语言处理、社交多媒体、生物信息学和健康信息学等领域。
- 该综述指出开放问题,以指导未来的 MVC 发展。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。