《计算机应用研究》|Application Research of Computers

面向大数据的K-means算法综述

Survey of K-means algorithms on big data

免费全文下载 (已被下载 次)  
获取PDF全文
作者 任远航
机构 电子科技大学 信息与软件工程学院
统计 摘要被查看 次,已被下载
摘要 随着信息技术的发展,移动互联网和物联网等领域正经历着迅猛的发展,海量的数据伴随产生,在海量数据下挖掘数据的模式正变得日益迫切与重要。聚类作为一种重要的数据挖掘方式,其在过去的几十年间一直被广泛研究。在所有的聚类问题中,K-means问题可能是最知名的一个。如何在海量数据下更快获得一个有理论保证的K-means的近似解则是一个关键问题,本篇文章将按照以下方式对这一问题的进展进行综述。首先,文章将定义K-means问题并介绍相关背景;然后,从理论保证和加速两个方面分别介绍国内外先进研究成果;最后,总结现有的成果并对未来的方向予以展望和预测。
关键词 聚类;K-means;采样;次线性时间算法;理论保证
基金项目
本文URL http://www.arocmag.com/article/02-2021-01-001.html
收稿日期
修回日期
页码 -
中图分类号 TP181
文献标志码