《计算机应用研究》|Application Research of Computers

一种倒排索引压缩方法

Method of inverted index compression

免费全文下载 (已被下载 次)  
获取PDF全文
作者 白福均,高建瓴,李宛蓉,贺思云,肖绍武
机构 贵州大学 大数据与信息工程学院;贵州大学 档案馆
统计 摘要被查看 次,已被下载
摘要 高效地访问倒排索引是搜索引擎快速响应用户查询的关键,而压缩倒排列表是提高搜索引擎性能的最重要的手段之一。针对自适应分段压缩ASCS算法进行了研究,对于ASCS算法中采用的均匀分段方式并非最优分段问题,提出以人工蜂群算法优化ASCS算法中的分段方式;对于ASCS算法考虑序列占用空间的影响因素过于单一问题,提出多因素下的改进算法;对于分布不均的长序列在ASCS算法下压缩率不理想问题,提出先排序后差分编码操作后再以ASCS算法压缩。通过对比实验证明优化改进后的算法可以较显著的压缩倒排索引。
关键词 搜索引擎;倒排索引;索引压缩;人工蜂群算法;ASCS算法
基金项目 贵州省档案局科研项目(2015D001)
贵州省科学技术基金项目(黔科合J字[2015]2045)
贵州大学研究生创新基金资助项目(研理工2017014,研理工2017016)
本文URL http://www.arocmag.com/article/02-2019-01-004.html
收稿日期
修回日期
页码 -
中图分类号 TP391
文献标志码