《计算机应用研究》|Application Research of Computers

基于语言模型的中文话头自足句识别方法

Nt clause recognition method based on language model

免费全文下载 (已被下载 次)  
获取PDF全文
作者 张禹尧,蒋玉茹,毛腾,张仰森
机构 北京信息科技大学 智能信息处理研究所
统计 摘要被查看 次,已被下载
摘要 自然语言处理中一项基础工作是句子的正确界定和识别。针对中文的文本结构特点,宋柔教授提出话头自足句理论。从该理论出发,进行标点句的话头自足句识别任务,探究语言模型在该任务中的应用效果。进一步划分该任务,可以将其分为单个标点句的话头自足句识别和标点句序列的话头自足句识别。在单个标点句的话头自足句识别任务中,对该任务在形式上进行了完整的定义,将其形式化为了机器阅读理解任务。从结果来看,在《围城》语料上取得了83.46%的准确率,在鱼类百科语料上的准确率达到91.21%。在标点句序列的话头自足句识别任务中,利用单个标点句的话头自足句识别任务中训练好的模型,以流水线的方式进行标点句序列的话头自足句识别,在鱼类百科语料上的准确率达到82.03%。实验结果表明提出的方法能有效的提高中文话头自足句识别的准确率。
关键词 话头自足句;语言模型;机器阅读理解
基金项目 国家自然科学基金资助项目(61602044、61772081)
促进高校内涵发展—研究生科技创新项目(5121911044)
本文URL http://www.arocmag.com/article/02-2021-02-023.html
收稿日期
修回日期
页码 -
中图分类号 TP391
文献标志码