admin 管理员组

文章数量: 1184232

 

论文地址:A Comprehensive Survey on Deep Clustering: Taxonomy, Challenges, and Future Directions | ACM Computing Surveys



摘要

聚类是机器学习中的一项基本任务,其目标是将实例分配到不同的组中,以便相似的样本归属于同一个簇,而不同的样本归属于不同的簇。传统的浅层聚类方法通常假设数据以特征向量的形式收集和表示,并在其内部进行聚类。然而,在处理高维数据(如图像、文本、视频和图)的聚类任务时,往往面临诸多挑战,例如表示的不加区分性以及实例间复杂的关系。

过去几十年来,深度学习在有效表示学习和复杂关系建模方面取得了显著成功。受到这些进展的启发,深度聚类(Deep Clustering)旨在通过深度学习技术提升聚类效果,并引起了学术界和工业界的广泛关注。尽管这一研究领域已取得了许多成果,但缺乏系统性的分析和全面的分类框架在一定程度上制约了其进一步发展。

在这篇综述中,首先探讨了如何将深度学习融入深度聚类,并识别出其两个核心组成部分:表示学习模块聚类模块。随后,总结并分析了这两个模块的代表性设计。此外,提出了一种基于这两个模块交互方式的全新深度聚类分类法,包括多阶段方法、生成式方法、迭代方法和同步方法。

除了理论分析,还介绍了知名的基准数据集、评估指标以及开源工具,以直观展示不同的实验方法。最后,探讨了深度聚类的实际应用场景,并提出了未来研究中亟待解决的关键挑战。

【论文阅读】A Comprehensive Survey on Deep Clustering: Taxonomy, Challenges, and Future Directions之总述-CSDN博客 中已经介绍了基本的概念,那这里将详细介绍深度聚类的表示学习模块。


表示学习模块

过去几十年,深度表示学习(Deep Representation Learning)取得了显著进展,尤其是在无监督方

本文标签: 论文 Survey deep Clustering Comprehensive