《计算机应用研究》|Application Research of Computers

一种基于局部密度的核K-means算法

Kernel K-means clustering algorithm based on local density

免费全文下载 (已被下载 次)  
获取PDF全文
作者 李米娜,朱玉全,陈耿,郝洪星
机构 1.江苏大学 计算机科学与通信工程学院,江苏 镇江 212013;2.南京审计学院 信息科学学院,南京 211815
统计 摘要被查看 次,已被下载
文章编号 1001-3695(2011)01-0078-03
DOI 10.3969/j.issn.1001-3695.2011.01.020
摘要 针对核K-means算法初始聚类中心点难以确定等问题,提出了一种基于局部密度的核K-means算法,该方法利用每个样本的局部相对密度来选择具有高密度且低相似性的样本来生成初始类中心点。实验结果表明,该算法能够很好地排除类边缘点和噪声点的影响,并且能够适应数据集中各个实际类别密度分布不平衡的情况,最终可以生成质量较高且波动性较小的聚类。
关键词 数据挖掘;局部密度;K-means
基金项目 江苏省“青蓝工程”资助项目;江苏省六大人才高峰资助项目(07-E-025);江苏省高校自然科学重大基金研究资助项目(08KJA520001);国家中小企业创新基金资助项目(09C26213203797);国家自然科学基金资助项目(70971067)
本文URL http://www.arocmag.com/article/1001-3695(2011)01-0078-03.html
英文标题 Kernel K-means clustering algorithm based on local density
作者英文名 LI Mi-na, ZHU Yu-quan, CHEN Geng, HAO Hong-xing
机构英文名 1. School of Computer Science & Telecommunications Engineering, Jiangsu University, Zhenjiang Jiangsu 212013, China; 2. School of Information Science, Nanjing Audit University, Nanjing 211815, China
英文摘要 In order to solve the problem that original clustering centers of kernel K-means algorithm is difficult to determine, proposed a kernel K-means clustering algorithm based on local density(LDKK).This algorithm applied local relative density of each data to choose the points with high density and low similarity as the initial cluster centers. Experimental results show that the algorithm can eliminate the impact of edge points and noise points, and adapt to the imbalance of each actual type of data set in the density distribution, which can eventually generate higher quality and less volatility clustering.
英文关键词 data mining; local density; K-means
参考文献 查看稿件参考文献
 
收稿日期
修回日期
页码 78-80
中图分类号
文献标志码 A