《计算机应用研究》|Application Research of Computers

DCKPDP:改进k-prototype聚类的差分隐私混合属性数据发布方法

Differential privacy mixed attribute data publishing method for improved k-prototype clustering

免费全文下载 (已被下载 次)  
获取PDF全文
作者 张星,张兴
机构 辽宁工业大学 电子与信息工程学院
统计 摘要被查看 次,已被下载
摘要 当前混合属性数据发布中隐私保护方法大都存在隐私保护效果不佳或数据效用较差的问题,采用差分隐私与优化的k-prototype聚类方法相结合,提出改进k-prototype聚类的差分隐私混合属性数据发布方法(DCKPDP)。为解决传统k-prototype聚类算法没有考虑不同数值型属性对聚类结果有较大影响的问题,利用信息熵为每个数值型属性添加属性权重;为解决聚类初始中心点人为规定或者由随机算法随机确定,导致聚类结果精确度不高的问题,结合数据对象的局部密度和高密度对聚类过程中初始中心点进行自适应选择;为解决数据信息泄露风险较高的问题,对聚类中心值进行差分隐私保护。实验结果表明,DCKPDP算法满足差分隐私保护所需的噪声量更小,数据的可用性更好。
关键词 差分隐私;混合属性数据;k-prototype聚类;密度优化;信息熵
基金项目 国家自然科学基金资助项目(61802161)
辽宁省教育厅科学研究经费项目(JZL202015402,JZL202015404)
本文URL http://www.arocmag.com/article/02-2022-01-049.html
收稿日期
修回日期
页码 -
中图分类号 TP309.
文献标志码