《计算机应用研究》|Application Research of Computers

移动新闻自适应采集方法研究

Research on adaptive crawling method of mobile news

免费全文下载 (已被下载 次)  
获取PDF全文
作者 胡建洪,徐建,董克源,高鑫
机构 南京理工大学 计算机科学与工程学院
统计 摘要被查看 次,已被下载
摘要 通过分析面向传统新闻门户网站和面向移动新闻应用的新闻采集方法的异同,提出了一种面向移动新闻应用的自适应新闻采集方法。该方法先通过代理对移动新闻应用与服务器通信的数据包进行解析,构造出移动新闻应用的站点地图;然后通过模拟用户行为自适应地增量采集新闻数据,提高更新效率并保证新闻采集的完整性。以国内外20多家主流的移动新闻应用为实验对象开展验证,实验结果表明该方法的有效性和实时性。
关键词 移动新闻应用;新闻爬虫;站点地图;自适应;增量更新
基金项目 赛尔网络下一代互联网技术创新项目(NGII20151202)
本文URL http://www.arocmag.com/article/02-2018-10-002.html
收稿日期
修回日期
页码 -
中图分类号 TP391
文献标志码