《计算机应用研究》|Application Research of Computers

利用词项语义共现和社团划分发现微博热点事件

Title Microblog hot topic detection using lexical semantic co-occurrence and community partition

免费全文下载 (已被下载 次)  
获取PDF全文
作者 李晓红,孔文文,马堉垠,马慧芳
机构 西北师范大学 计算机科学与工程学院
统计 摘要被查看 次,已被下载
摘要 针对传统词项之间语义关系抽取难以适用于微博,导致发现微博热点事件不敏感的问题,提出一种基于词项语义共现和社团划分的方法发现热点事件。首先利用热度定义对微博数据进行初次筛选,通过构建共现词项图来模拟词项间的语义相关性,并结合修改的tf-idf公式计算词项间的语义相关度;然后借助社区划分和模块度的概念对词项图进行划分,完成词项聚类,进而获得热点事件。实验结果表明,与同类方法相比,所提方法的准确率较高,发现的热点事件与实时事件基本保持一致,具有较好的热点识别效果。
关键词 热度;亲密度;语义相关性;热点事件;模块度
基金项目 国家自然科学基金资助项目(61862058,61762078)
甘肃省青年基金资助项目(1606RJYA269)
西北师范大学青年教师科研能力提升计划项目(NWNU-LKQN-14-5,NWNU-LKQN-16-20)
本文URL http://www.arocmag.com/article/02-2020-05-012.html
收稿日期
修回日期
页码 -
中图分类号 TP
文献标志码