《计算机应用研究》|Application Research of Computers

并行化软件开发日志聚类分析方法研究

Log cluster analysis based on parallel software development

免费全文下载 (已被下载 次)  
获取PDF全文
作者 刘原序,常朝稳,韩培胜
机构 信息工程大学 密码工程学院
统计 摘要被查看 次,已被下载
摘要 针对原始日志数据存在的粒度过细,数据量不断增长,难以直接用于流程分析的问题,提出一种并行化的日志聚类算法,首先利用FSLVM和IDF-IF来实现日志进行的向量化,再利用P-Chameleon算法对向量化后的日志信息进行聚类。为了解决Chameleon算法计算效率低,无法处理大规模数据的问题,实现了对Chameleon算法的并行化。最后针对算法的聚类性能、通信开销和实际运用效果进行了评估。实验表明P-Chameleon算法能较好的适应大规模数据集,并且对于真实日志文件进行聚类后能明显减少了流程的复杂度,对于软件开发流程的易理解性有明显的提高。
关键词 软件开发项目;质量管理;聚类;并行化
基金项目 面向用户的可信云计算环境安全研究(61572517)
本文URL http://www.arocmag.com/article/02-2019-04-001.html
收稿日期
修回日期
页码 -
中图分类号 TP391
文献标志码