计算机软件及计算机应用论文_基于边界点检测的
2022/01/24文章摘要:密度聚类算法因具有对噪声鲁棒、能够发现任意形状的类等优点,得到了广泛的应用。但是,在实际应用中,该类算法面临着由于数据集中不同类的密度分布不均,且类与类之间的边界难以区分等导致聚类效果较差的问题。为了解决以上问题,提出了一个基于边界点检测的变密度聚类算法。首先,基于给出的相对密度度量方法识别变密度类之间的边界点,以此来增强相邻类的可分性;其次,对非边界区域的点进行聚类以找到数据集的核心类结构;接着,依据高密度近邻分配原则将检测到的边界点分配到相应的核心类结构中;最后,基于类结构信息识别数据集中的噪声点。在人造数据集和UCI数据集上与Kmeans、DBSCAN、DPCA、CLUB、BP聚类算法进行了比较分析。实验结果表明,提出的算法可以有效解决类分布密度不均、边界难以区分的问题,并在ARI、NMI、FM、ACC评价指标上优于已有算法;在运行效率分析中,当数据规模较大时,VDCBD算法运行效率高于DPCA、CLUB和BP算法。
文章关键词:
论文分类号:TP311.13
