《计算机应用研究》|Application Research of Computers

基于word2vec的跨领域情感分类方法

Cross-domain sentiment classification based on word2vec

免费全文下载 (已被下载 次)  
获取PDF全文
作者 王勤勤,张玉红,李培培,胡学钢
机构 合肥工业大学 计算机与信息学院
统计 摘要被查看 次,已被下载
摘要 情感分类是用于判断数据的情感极性,广泛用于商品评论,微博话题等数据。标记信息的昂贵使得传统的情感分类方法难以对不同领域的数据进行有效的分类。为此,跨领域情感分类问题引起广泛关注。已有的跨领域情感分类方法大多以共现为基础提取词汇特征和句法特征,而忽略了词语间的语义关系。基于此,提出了基于word2vec的跨领域情感分类方法WEEF(cross-domain classification based on word embedding extension feature),选取高质量的领域共现特征作为桥梁,并以这些特征作为种子,基于词向量的相似度计算,将领域专有特征扩充到这些种子中,形成特征簇,从而减小领域间的差异。在SRAA和Amazon产品评论数据集上的实验结果表明方法的有效性,尤其在数据量较大时。
关键词 语义特征;共现特征;词向量;跨领域情感分类
基金项目 国家重点研发计划资助项目(2016YFC0801406)
国家自然科学基金资助项目(61673152,61503112)
本文URL http://www.arocmag.com/article/02-2018-10-004.html
收稿日期
修回日期
页码 -
中图分类号 TP391
文献标志码