计算机软件及计算机应用论文_面向本地差分隐私
2022/01/27文章摘要:针对在聚类分析中保护数据隐私的同时确保数据的可用性的问题,提出一种基于本地差分隐私技术的聚类方案--LDPK-Prototypes。首先,用户对混合型数据集进行编码;然后,采用随机响应机制对敏感数据进行扰动,第三方收集到用户的扰动数据后以最大程度恢复原始数据集,并进行K-Prototypes聚类算法,在聚类过程中,使用相异性度量方法确定初始聚类中心,利用熵权法重新定义新的距离计算公式。理论分析和实验结果表明,与基于中心化差分隐私技术的ODPC算法相比较,在Adult和Heart数据集上平均准确率分别提高了2.95%和12.41%,有效提高了聚类的可用性。同时,LDPK-Prototypes扩大了数据之间差异性,有效避免了局部最优,提高了聚类算法的稳定性。
文章关键词:
论文分类号:TP309
