《计算机应用研究》|Application Research of Computers

基于模糊熵特征选择算法的SVM在漏洞分类中的研究

Research on vulnerability classification based on SVM with fuzzy entropy feature selection algorithm

免费全文下载 (已被下载 次)  
获取PDF全文
作者 张鹏,谢晓尧
机构 贵州师范大学 贵州省信息与计算科学重点实验室,贵阳 550001
统计 摘要被查看 次,已被下载
文章编号 1001-3695(2015)04-1145-04
DOI 10.3969/j.issn.1001-3695.2015.04.044
摘要 漏洞的分类能够有效提高漏洞分析和修复的效率,其分类的方式是按照漏洞的特征进行,将漏洞特征的提取转换为漏洞文本特征的提取。针对漏洞的描述性文本较短,特征选择模糊等缺点,提出了一种基于模糊熵特征选择算法的SVM的漏洞分类方法对漏洞分类进行研究。该方法结合模糊熵理论和支持向量机分类方法的优点,设计类间类内隶属度函数来体现特征项的分布情况,并结合模糊熵的计算作为漏洞特征提取的依据,通过SVM进行分类学习,对漏洞进行分类。仿真实验表明,基于模糊熵特征选择算法的SVM的漏洞分类方法实际可行,且分类准确率高于基于KNN和最大熵模型的分类方法,具有一定的研究意义。
关键词 模糊熵;支持向量机;漏洞特征;漏洞文本;特征选择;漏洞分类
基金项目 国家科技支撑计划资助项目(2011BAH14B04)
中央财政支持地方高校发展专项基金资助项目(财教[2012]140号)
本文URL http://www.arocmag.com/article/01-2015-04-044.html
英文标题 Research on vulnerability classification based on SVM with fuzzy entropy feature selection algorithm
作者英文名 ZHANG Peng, XIE Xiao-yao
机构英文名 Key Laboratory of Information & Computing Science of Guizhou Province, Guizhou Normal University, Guiyang 550001, China
英文摘要 The classification of vulnerability can improve the efficiency of vulnerability analysis and repair, its way is accor-ding to the characteristics of vulnerability, extracting the features of vulnerability texts to replace the features of vulnerability.This paper proposed a vulnerability classification method which was based on SVM with fuzzy entropy feature selection algorithm.This method combined the advantage of the fuzzy entropy theory and support vector machine, designed the membership function which was relied on between-class and inner-class dispersion to reflect the feature’s distribution.At the same time, it used SVM to do the classification learning which combined with feature extraction through the fuzzy entropy.Through the simulation results, the way of the vulnerability classification which is based on SVM with fuzzy entropy feature selection algorithm is practical and gets a higher classification accuracy rate than the classification method which is based on KNN or maximum entropy models.
英文关键词 fuzzy entropy; support vector machine; the features of vulnerability; vulnerability texts; selective gain; Vulnerability classification
参考文献 查看稿件参考文献
  [1] 李明. 计算机漏洞研究的现状以及基于分类的防范技术[J] . 硅谷, 2012(13):22, 126.
[2] 李学相. 改进的最大熵权值算法在文本分类中的应用[J] . 计算机科学, 2012, 39(6):210-212.
[3] 张爱科. 基于改进的最大熵均值聚类方法在文本分类中的应用[J] . 计算机应用研究, 2012, 29(4):1297-1299.
[4] 马驰, 高岭, 孙骞, 等. 基于模糊理论的漏洞危害等级评估[J] . 计算机应用研究, 2014, 31(3):815-818, 824.
[5] 庞剑锋, 卜东波, 白硕. 基于向量空间模型的文本自动分类系统的研究与实现[J] . 计算机应用研究, 2001, 18(9):23-26.
[6] 刘少辉, 董明楷, 张海俊, 等. 一种基于向量空间模型的多层次文本分类方法[J] . 中文信息学报, 2001, 16(3):8-14, 26.
[7] VAPNIK V. The nature of statistical learning theory[M] . New York:Springer-Verlag, 1995:112-268.
[8] 李红英. 支持向量分类机的核函数研究[D] . 重庆:重庆大学, 2009.
[9] 杨淑莹. 模式识别与智能计算[M] . 北京:电子工业出版社, 2011.
[10] De LUCA A, TERMINI S. A definition of a nonprobabilities entropy in the setting of fuzzy set theory[J] . Inform and Control, 1972, 20(4):301-312.
[11] 侯浩俊. 软件漏洞虚拟验证平台的研究[D] . 成都:电子科技大学, 2013.
[12] 高寅生. 安全漏洞库设计与研究[J] . 微电子学与计算机, 2004, 24(3):99-101.
收稿日期 2014/3/30
修回日期 2014/5/14
页码 1145-1148
中图分类号 TP393.08
文献标志码 A