《计算机应用研究》|Application Research of Computers

基于动态BLSTM和CTC的濒危语言语音识别研究

Endangered languages speech recognition based on dynamic BLSTM and CTC

免费全文下载 (已被下载 次)  
获取PDF全文
作者 于重重,陈运兵,孙沁瑶,刘畅,徐世璇,尹蔚彬
机构 北京工商大学 计算机与信息工程学院;中国社会科学院民族学与人类学研究所
统计 摘要被查看 次,已被下载
摘要 针对低资源的濒危语言进行了端到端语音识别模型的建立与研究,能够为濒危语言的保护和传承探索出新的途径。采用动态双向长短时记忆网络与连接时序分类模型构造端到端的语音识别系统,在做音素级别的识别训练时,传入模型的数据批量大小根据训练模型做自适应调整,不仅能够加快收敛速度,而且能够提高模型的泛化性。通过修改网络层次与结构参数,并提取不同的语音特征进行模型对比,实验结果表明在两种濒危语言——吕苏语和土家语的数据集上均取得了较好的识别效果。
关键词 濒危语言语音识别;端到端;动态双向长短时记忆网络;连接时序分类模型
基金项目 国家教育部人文社会科学研究规划基金资助项目(16YJAZH072)
国家社会科学基金重大项目(14ZDB156)
本文URL http://www.arocmag.com/article/02-2019-11-016.html
收稿日期
修回日期
页码 -
中图分类号 TP391.42
文献标志码