《计算机应用研究》|Application Research of Computers

基于可伸缩l-多样性的大数据发布隐私保护

Big data publishing privacy protection based on scalable l-diversity

免费全文下载 (已被下载 次)  
获取PDF全文
作者 邹劲松,李芳
机构 重庆水利电力职业技术学院 普天大数据产业学院;重庆大学 计算机学院
统计 摘要被查看 次,已被下载
摘要 针对非结构化大数据发布中的隐私保护问题,提出了一种基于改进的可伸缩l-多样性(improved scalable l-diversity,ImSLD)大数据发布隐私保护方法。该算法采用基于两阶段条件随机场的命名实体识别(named entity recognition,NER)方法将非结构化数据表示为结构化形式,设计一种改进的可伸缩l-多样性算法来对表现良好的非结构化数据进行匿名化,实现保护非结构化大数据发布的隐私,通过Apache Pig实现ImSLD算法来使其具有可伸缩性。实验表明与MRA算法和SKA算法相比,改进的ImSLD算法在不同数据集上提供相同级别的隐私时信息损失均优于对比的另外两种算法。
关键词 大数据发布隐私保护;l-多样性;k-匿名;非结构化大数据;命名实体识别
基金项目 重庆市高等教育学会2017-2018年高等教育科学研究课题(CQGJ17046A)
重庆市教育科学"十三五"规划2017年度重点无经费课题(2017-GX-181)
本文URL http://www.arocmag.com/article/02-2021-02-046.html
收稿日期
修回日期
页码 -
中图分类号 TP393
文献标志码