摘要:
聚类是一种无监督学习方法,它通过对样本特征分析度量数据间的相似性和差异性,利用簇内相似性高、簇间差异性大的特性对数据进行自动化分组,被广泛应用于计算机视觉、文本挖掘、生物信息等领域。聚类算法在鲁棒性、普适性、类数选择等方面存在提升空间,且算法的效果很大程度上受到数据集密度和流形的影响。提出了基于局部结构自表达的鲁棒演化聚类算法,该算法通过使用径向基函数并加入先验信息获取数据的局部密度差异特征,构建全新的相似性度量,在此过程融入了数据局部结构特征的提取机制和稳定类的识别机制,使聚类具有更好的鲁棒性和普适性。动态演化聚类在这两个方面有着天然的优势,可在动态的聚类过程中持续优化聚类结果,使得聚类效果得到了很大改进。新算法通过数据集结构信息自表达对局部和整体特征进行信息融合,同时在动态的演化过程中监控类的稳定性,从而得到更好的聚类结果。在人工数据集和真实数据集上的实验结果表明,新算法的聚类性能更优越。
中图分类号:
李春忠, 鞠文亮, 靖凯立, 桂 扬. 基于局部结构自表达的鲁棒演化聚类算法[J]. 工程数学学报, 2024, 41(6): 1006-1020.
LI Chunzhong, JU Wenliang, JING Kaili, GUI Yang. A Robust Evolutionary Clustering Algorithm Based on Local Structure Self-expression[J]. Chinese Journal of Engineering Mathematics, 2024, 41(6): 1006-1020.