《计算机应用研究》|Application Research of Computers

DENGENE:一种高精度的基于密度的适用于基因表达数据的聚类算法

DENGENE: High Accurate Densitybased Clustering Algorithm for Gene Expression Data

免费全文下载 (已被下载 次)  
获取PDF全文
作者 孙亮,赵芳,王永吉
机构 1.中国科学院 软件研究所 互联网软件技术实验室,北京 100080;2.香港理工大学 计算学系 生物识别中心,香港;3.中国科学院 软件研究所 计算机科学重点实验室,北京 100080;4.中国科学院 研究生院,北京 100049
统计 摘要被查看 次,已被下载
文章编号 1001-3695(2007)04-0058-04
DOI 10.3969/j.issn.1001-3695.2007.04.014
摘要 根据基因表达数据的特点,提出一种高精度的基于密度的聚类算法DENGENE。DENGENE通过定义一致性检测和引进峰点改进搜索方向,使得算法能够更好地处理基因表达数据。为了评价算法的性能,选取了两组广为使用的测试数据,即啤酒酵母基因表达数据集对算法来进行测试。实验结果表明,与基于模型的五种算法、CAST算法、K均值聚类等相比,DENGENE在滤除噪声和聚类精度方面取得了显著的改善。
关键词 基因表达数据;聚类分析;基于密度的聚类;一致性检测;峰点
基金项目 国家自然科学基金资助项目(60373053); 中国科学院“百人计划”基金资助项目; 中国科学院与英国皇家学会联合资助项目(20030389,20032006); 留学回国人员科研启动基金项目([2003]406)
本文URL http://www.arocmag.com/article/1001-3695(2007)04-0058-04.html
英文标题 DENGENE: High Accurate Densitybased Clustering Algorithm for Gene Expression Data
作者英文名 SUN Liang, ZHAO Fang, WANG Yong-ji
机构英文名 1. Laboratory for Internet Software Technologies, Institute of Software, Chinese Academy of Sciences, Beijing 100080, China; 2. Biometrics Research Centre, Dept. of Computing, Hongkong Polytechnic University, Hongkong China; 3. Laboratory of Computer Scienc
英文摘要 According to the characteristics of gene expression data, a high accurate densitybased clustering algorithm called DENGENE was proposed. DENGENE achieves good clustering by defining homogeneity test and peak points. To evaluate the performance of DENGENE, two budding yeast Saccharomyces cerevisiae data sets, which are widely used as test data sets, were used to validate the effectiveness of DENGENE. The experiment results show that compared with five modelbased clustering algorithms, CAST and Kmeans clustering, DENGENE filters noises effectively and produces more accurate clustering results.
英文关键词
参考文献 查看稿件参考文献
 
收稿日期
修回日期
页码 58-61
中图分类号
文献标志码 A