《计算机应用研究》|Application Research of Computers

基于事务映射区间求交的高效频繁模式挖掘算法

Efficient frequent pattern mining algorithm based on interval interaction and transaction mapping

免费全文下载 (已被下载 次)  
获取PDF全文
作者 吴磊,程良伦,王涛
机构 广东工业大学 计算机学院;广东工业大学 自动化学院
统计 摘要被查看 次,已被下载
摘要 关联规则挖掘是数据挖掘重要研究课题,大数据处理对关联规则挖掘算法效率提出了更高要求,而关联规则挖掘的最耗时的步骤是频繁模式挖掘。针对当前频繁模式挖掘算法效率不高的问题,结合Apriori算法和FP-growth算法,提出一种基于事务映射区间求交的频繁模式挖掘算法IITM(interval interaction and transaction mapping),只需扫描数据集两次来生成FP树,然后扫描FP树将每个项的ID映射到区间中,通过区间求交来进行模式增长。该算法解决了Apriori算法需要多次扫描数据集,FP-growth算法需要迭代地生成条件FP树来进行模式增长而带来的效率下降的问题。在真实数据集上的实验显示,在不同的支持度下IITM算法都要要优于Apriori、FP-growth以及PIETM算法。
关键词 关键词:数据挖掘;频繁模式;事务映射;区间求交
基金项目 智能制造物联网的数据感知
传输和海量数据处理
国家基金广东省联合基金重点项目
(U1201251)
面向船舶产品的智能制造集成平台研究及产业化
广东省省级科技计划项目
(2016B090918045)制造物联网协同感知的服务组合优化模型与寻优算法研究
国家自然科学基金青年科学基金项目(61502110)
本文URL http://www.arocmag.com/article/02-2019-04-008.html
收稿日期
修回日期
页码 -
中图分类号 TP301
文献标志码