《计算机应用研究》|Application Research of Computers

一种基于邻域系统密度差异度量的离群点检测算法

Outlier detection algorithm based on neighborhood system density difference measurement

免费全文下载 (已被下载 次)  
获取PDF全文
作者 杜旭升,于炯,陈嘉颖,王跃飞,蒲勇霖,叶乐乐
机构 新疆大学 软件学院;新疆大学 信息科学与工程学院;西安交通大学 软件学院
统计 摘要被查看 次,已被下载
摘要 离群点检测是数据挖掘中热点研究方向之一。针对离群点检测算法LOF在高维离散分布数据集中检测精度较低及参数敏感性较高的问题,提出了基于邻域系统密度差异度量的离群点检测NSD(neighborhood system density difference)算法。算法相较于传统基于密度的离群点检测方法引入了截取距离的概念,首先计算数据集中对象在截取距离内的邻居点个数;其次计算对象的邻域系统密度;然后将对象的密度与它邻居的密度进行比较,判定目标对象与其邻居趋向于同一簇的程度;最后将最可能是离群点的对象输出。将NSD算法与LOF、LDOF、CBOF算法在真实数据集与合成数据集中对比实验发现,NSD算法具有较高的检测准确率和执行效率以及较低的参数敏感性,证明了NSD算法是有效可行的。
关键词 数据挖掘;离群点检测;基于密度;LOF;LDOF;CBOF
基金项目 国家自然科学基金资助项目(61862060,61462079,61562086,61562078)
本文URL http://www.arocmag.com/article/02-2020-07-013.html
收稿日期
修回日期
页码 -
中图分类号 TP311.1
文献标志码