《计算机应用研究》|Application Research of Computers

基于模糊蚁群的加权蛋白质复合物识别算法

Algorithm for identifying weighted protein complexes based on fuzzy ant colony clustering

免费全文下载 (已被下载 次)  
获取PDF全文
作者 毛伊敏,刘银萍,胡健
机构 江西理工大学 信息工程学院;江西理工大学 应用科学学院 信息工程系
统计 摘要被查看 次,已被下载
摘要 针对蚁群融合模糊C-means (FCM)聚类算法在蛋白质相互作用网络中进行复合物识别的准确率不高、召回率较低以及时间性能不佳等问题进行了研究,提出一种基于模糊蚁群的加权蛋白质复合物识别算法FAC-PC (algorithm for identifying weighted protein complexes based on fuzzy ant colony clustering)。首先,融合边聚集系数与基因共表达的皮尔逊相关系数构建加权网络;其次提出EPS (essential protein selection)度量公式来选取关键蛋白质,遍历关键蛋白质的邻居节点,设计蛋白质适应度PFC (protein fitness calculation)来获取关键组蛋白质,利用关键组蛋白质替换种子节点进行蚁群聚类,克服蚁群算法中因大量拾起放下和重复合并过滤操作而导致准确率和收敛速度过慢的缺陷;接着设计相似度SI (similarity improvement)度量优化拾起放下概率来对节点进行蚁群聚类进而获得聚类数目;最后将关键蛋白质和通过蚁群聚类得到的聚类数目初始化FCM算法,设计隶属度更新策略来优化隶属度的更新,同时提出兼顾类内距和类间距的FCM迭代目标函数,最终利用改进的FCM完成复合物的识别。将FAC-PC算法应用在DIP数据上进行复合物的识别,实验结果表明FAC-PC算法的准确率和召回率较高,能够较准确地识别蛋白质复合物。
关键词 蛋白质相互作用网络;蚁群聚类算法;模糊C-means;适应度;蛋白质复合物
基金项目 国家自然科学基金资助项目(41562019,41530640)
江西省自然科学基金资助项目(GJJ161566)
江西省教育厅科技项目(GJJ151528GJJ181504)
本文URL http://www.arocmag.com/article/02-2020-05-011.html
收稿日期
修回日期
页码 -
中图分类号 TP399
文献标志码