《计算机应用研究》|Application Research of Computers

基于融合注意力机制的图像标题生成

Image caption generation based on fusion attention mechanism

免费全文下载 (已被下载 次)  
获取PDF全文
作者 侯一雯,田玉玲
机构 太原理工大学 信息与计算机学院
统计 摘要被查看 次,已被下载
摘要 图像标题生成利用机器自动产生描述图像的句子,属于计算机视觉与自然语言处理的交叉领域。传统基于注意力机制的算法侧重特征图不同区域,忽略特征图通道,易造成注意偏差。该模型通过当前嵌入单词与隐藏层状态的耦合度来赋予特征图不同通道相应权重,并将其与传统方法结合为融合注意力机制,准确定位注意位置。实验结果均在指定的评估方法上有一定的提升,表明该模型可以生成更加流利准确的自然语句。
关键词 图像标题生成;注意偏差;通道;耦合度;融合注意力
基金项目 国家自然科学基金资助项目(61472271)
本文URL http://www.arocmag.com/article/02-2021-06-052.html
收稿日期
修回日期
页码 -
中图分类号 TP391.4
文献标志码