《计算机应用研究》|Application Research of Computers

基于扩展规则与统计特征的未登录词识别

Unregistered word recognition based on expansion rules and statistical features

免费全文下载 (已被下载 次)  
获取PDF全文
作者 曾浩,詹恩奇,郑建彬,汪阳
机构 武汉理工大学 信息工程学院;光纤传感技术与信息处理教育部重点实验室
统计 摘要被查看 次,已被下载
摘要 为提高各行业领域未登录词识别效果,提出一种基于扩展规则与统计特征的未登录词识别方法。分析行业领域未登录词构词特点,制定扩展规则,根据扩展规则对分词项进行扩展得到复合词,通过词频、互信息、邻接熵等统计特征判别复合词是否为未登录词,若为未登录词,则对其继续扩展和识别。6个行业领域和通用领域未登录词识别实验结果表明,提出方法取得了较好的未登录词识别效果,具有较好的移植性。
关键词 未登录词;扩展规则;词频;互信息;邻接熵
基金项目
本文URL http://www.arocmag.com/article/02-2019-09-007.html
收稿日期
修回日期
页码 -
中图分类号 TP391
文献标志码