《计算机应用研究》|Application Research of Computers

基于高阶差分和网格划分算法的DBSCAN参数自动选取算法

Dbscan parameter setting based on higher-order difference and grid partition algorithm

免费全文下载 (已被下载 次)  
获取PDF全文
作者 兰红,朱合隆
机构 江西理工大学 信息工程学院
统计 摘要被查看 次,已被下载
摘要 针对DBSCAN算法中的两个参数eps和minPts通常依靠经验选取所带来的不足,提出一种高阶差分和网格划分相结合的快速DBSCAN自动参数选取算法。首先分析数据集中数据点与参数的关系,通过引入高阶差分算法,自动获取eps和minPts两个参数;然后利用网格划分,对数据集建立网格索引,优化算法的运行效率,最后针对噪声点过多的数据集,提出去极化操作,增强算法的鲁棒性。算法应用于Flame等九个数据集,分别与传统DBSCAN算法和AGD-DBSCAN算法选取的参数,进行聚类效果和算法运行效率的对比分析。结果表明提出的基于高阶差分自动选取参数算法是一种有效的DBSCAN参数自动选取方法,网格划分显著提升了高阶差分算法的性能,去极化操作必要且有效,算法具有很好的实用性。
关键词 密度聚类;参数选取;高阶差分;网格划分;去极化
基金项目 国家自然科学基金资助项目(61762046)
江西省自然科学基金资助项目(20161BAB212048)
本文URL http://www.arocmag.com/article/02-2020-11-006.html
收稿日期
修回日期
页码 -
中图分类号 TP274
文献标志码