《计算机应用研究》|Application Research of Computers

一种快速的交集型歧义检测方法

Fast crossing ambiguity detection method

免费全文下载 (已被下载 次)  
获取PDF全文
作者 刘健,张维明
机构 国防科学技术大学 信息系统与管理学院,长沙 410073
统计 摘要被查看 次,已被下载
文章编号 1001-3695(2008)11-3259-03
DOI 10.3969/j.issn.1001-3695.2008.11.016
摘要 中文分词中,交集型歧义检测方法采用的双向最大匹配法与全切分方法存在着各自的弊病,无法满足大规模数据的精确处理。为此,提出了一种快速的交集型歧义检测方法,引入次长词进行检测,能高效准确地检测出中文文本中的交集型歧义。经实验验证,该方法在精度与速度两方面均能满足大规模语料的处理。
关键词 中文分词;交集型歧义;最长交集字段
基金项目 国家自然科学基金资助项目(70371008)
本文URL http://www.arocmag.com/article/1001-3695(2008)11-3259-03.html
英文标题 Fast crossing ambiguity detection method
作者英文名 LIU Jian, ZHANG Wei-ming
机构英文名 School of Information System & Management, National University of Defense Technology, Changsha 410073, China
英文摘要 In Chinese word segmentation, the FBMM and word omnisegmentation were widely used to detect OAS, but the shortcomings of their existence make them unable to meet demand. This paper presented a rapid crossing ambiguity detection method, which could efficient and accurate detect the OAS. The experiment shows the new method accuracy and speed in the two areas can meet the handling largescale corpus.
英文关键词 Chinese word segmentation; crossing ambiguity; maximal overlapping ambiguity string(MOAS)
参考文献 查看稿件参考文献
 
收稿日期
修回日期
页码 3259-3261
中图分类号
文献标志码 A