《计算机应用研究》|Application Research of Computers

移动互联网流量分类的多特征集合和多类别标签研究

Comprehensive research on multiple feature sets and multiple label sets for mobile network traffic classification

免费全文下载 (已被下载 次)  
获取PDF全文
作者 黄燚,刘珍,王若愚,陈洁桐
机构 广东药科大学医药信息工程学院;华南理工大学信息网络工程研究中心;广东省计算机网络重点实验室
统计 摘要被查看 次,已被下载
摘要 近年来,随着智能移动设备和移动App的广泛应用,移动App每天产生大量的网络流量。移动互联网流量分类/聚类是有效管理网络流量的重要基础。但是,已有文献采集的移动互联网流量数据来源不同、流量数据标签级别不同、描述流量数据的特征集合不同,所获得的实验结果无法进行直接比较。目前仍然缺乏系统的实验比较分析机器学习方法在不同类别标签和不同特征集合描述的移动互联网流量数据上的分类/聚类性能。借助于Mobilegt系统采集移动App产生的网络流量数据,从两种粒度标记流量数据(App级别和功能级别),从单向流和双向流分别获取不同的特征集合,进而综合性实验分析各种机器学习算法在不同标记粒度和不同特征集合描述的移动互联网流量数据上的分类/聚类性能。实验结果表明,流统计特征方面,基于单向流的统计特征更优;在分类算法方面,随机森林和Adaboost算法更优,聚类算法方面,K均值方法更优。
关键词 移动App流量;机器学习算法;分类方法;聚类方法;流式数据
基金项目 国家自然科学基金资助项目(61501128)
广东省自然科学基金资助项目(2017A030313345)
国家级大学生创新创业训练计划项目(201710573005,广东药科大学创新强校工程项目)
中央高校基本业务费资助项目(x2rj/D2174870)
本文URL http://www.arocmag.com/article/02-2020-11-004.html
收稿日期
修回日期
页码 -
中图分类号 TP393
文献标志码