《计算机应用研究》|Application Research of Computers

基于双视角投影空间表示的文本多标签标注方法

Multi-label annotation of text via double-view projection representation

免费全文下载 (已被下载 次)  
获取PDF全文
作者 温雯,韦滨,杜文俊,蔡瑞初,郝志峰
机构 1.广东工业大学 计算机学院,广州 510006;2.佛山科学技术学院 数学与大数据学院,广东 佛山 528000;3.东北大学 工商管理学院,沈阳 110004
统计 摘要被查看 次,已被下载
文章编号 1001-3695(2020)09-024-2684-05
DOI 10.19734/j.issn.1001-3695.2019.04.0123
摘要 在传统的多标签文本标注领域中,面临着维数灾难和双信息源数据的问题。针对这两个问题,提出一种基于双视角投影空间表示的文本多标签标注方法,通过交替方向乘子法和Bregman迭代对目标函数进行优化求解,得到低维的隐语义投影空间。在雅虎和路透社的新闻数据集上的实验结果验证表明,该方法在解决文本多标签标注问题上性能有明显的提高,其在召回率、覆盖误差和排名平均精度方面优于近年来的其他方法,可应用于新闻推荐,标签系统和情感分析等场景中。
关键词 投影空间; 文本标注; 多标签; 双视角
基金项目 国家自然科学基金资助项目(61876043)
NSFC-广东联合基金资助项目(U1501254)
本文URL http://www.arocmag.com/article/01-2020-09-024.html
英文标题 Multi-label annotation of text via double-view projection representation
作者英文名 Wen Wen, Wei Bin, Du Wenjun, Cai Ruichu, Hao Zhifeng
机构英文名 1.School of Computer Science & Technology,Guangdong University of Technology,Guangzhou 510006,China;2.School of Mathematics & Big Data,Foshan University,Foshan Guangdong 528000,China;3.School of Business Administration,Northeast University,Shenyang 110004,China
英文摘要 In the field of traditional multi-label text annotation, it faces the problem of dimensional disaster and dual information source data. Hence, this paper proposed a text multi-label annotation of text via double-view projection representation. It optimized the objective function by alternating direction multiplier method and Bregman iteration to obtain low-dimensional implicit semantic projection space. The experimental result on the news datasets of Yahoo and Reuters shows that this method has been significantly improved in solving the problem of multi-label labeling of texts. It is superior to other methods in recent years in terms of recall rate, coverage error, and ranking average precision, and it can be applied to news recommendations, tagging systems and sentiment analysis.
英文关键词 projection space; text classification; multi-label; double-view
参考文献 查看稿件参考文献
 
收稿日期 2019/4/9
修回日期 2019/6/17
页码 2684-2688
中图分类号 TP391.1
文献标志码 A