《计算机应用研究》|Application Research of Computers

基于多层次注意力机制一维DenseNet的音频事件检测

Sound event detection based on ld DenseNet with multi-level attention

免费全文下载 (已被下载 次)  
获取PDF全文
作者 杨吕祥,胡燕
机构 武汉理工大学 计算机科学与技术学院
统计 摘要被查看 次,已被下载
摘要 在音频事件检测任务中,目标音频易受背景噪声等因素的干扰,并且其在音频信号流中存在的比例不高,针对这些问题,提出一种多层次注意力机制一维DenseNet(dense convolutional network)音频事件检测模型。首先,使用一维DenseNet模型进行帧级检测能有效地检测音频事件发生的开始和结束时间;其次,在一维DenseNet模型中引入多层次注意力机制,这使得不同模块的感知特性随着网络层数的加深而自适应地变化。因此,模型可以在不同的网络层次自动选择和关注重要的目标帧而抑制不相关的背景帧。在DCASE 2017任务2的开发数据集上的实验表明,该方法的整体性能较传统的深度学习方法有进一步提高。
关键词 音频事件检测;深度学习;DensetNet;多层次注意力机制
基金项目 湖北省自然科学基金重点类项目(2017CFA012)
本文URL http://www.arocmag.com/article/02-2020-06-011.html
收稿日期
修回日期
页码 -
中图分类号 TP391
文献标志码