《计算机应用研究》|Application Research of Computers

融合主题特征的文本自动摘要方法研究

Research on automatic text summarization combining topic feature

免费全文下载 (已被下载 次)  
获取PDF全文
作者 罗芳,汪竞航,何道森,蒲秋梅
机构 武汉理工大学 计算机科学与技术学院;香港恒生大学 供应链及资讯管理系;中央民族大学 信息工程学院
统计 摘要被查看 次,已被下载
摘要 针对传统图模型方法进行文本摘要时只考虑统计特征或浅层次语义特征,缺乏对深层次主题语义特征挖掘与利用,提出了融合主题特征后多维度度量的文本自动摘要方法MDSR(Muti-Dimension Summarization Rank)。首先利用LDA主题模型对文本主题语义信息进行挖掘,定义了主题重要度以衡量主题特征对句子重要程度的影响,然后结合主题特征、统计特征和句间相似度,改进了图模型节点的概率转移矩阵的构建方式,最后根据句子节点权重进行摘要的抽取与度量。实验结果显示,当主题特征、统计特征及句间相似度权重比例达到3:4:3时,MDSR方法的ROUGE评测值达到最佳,ROUGE-1值达到53.35%,ROUGE-2值达到35.18%,ROUGE-SU4值达到33.86%,优于对比方法,表明了融入主题特征后的文本摘要方法有效提高了摘要抽取的准确性。
关键词 TextRank;文本摘要;语义特征;主题模型;概率转移矩阵
基金项目 教育部人文社会科学研究规划基金资助项目(18YJAZH087)
武汉理工大学自主创新研究基金资助项目(3120600100)
本文URL http://www.arocmag.com/article/02-2021-01-010.html
收稿日期
修回日期
页码 -
中图分类号 TP391
文献标志码