《计算机应用研究》|Application Research of Computers

新的动态记忆网络的视觉问答

New dynamic memory network for visual question answering

免费全文下载 (已被下载 次)  
获取PDF全文
作者 王永琦,吴飞,王春媛,江潇潇
机构 上海工程技术大学 电子电气工程学院
统计 摘要被查看 次,已被下载
摘要 视觉问答任务,旨在给机器输入一幅图像和一相关问题,计算机能够准确作答。针对这一任务,对记忆和注意力机制的神经网络结构进行了深入研究,这类网络显示出问题回答所需的某些推理能力。在分析动态记忆网络DMN的基础上,提出了一种新的动态记忆网络,对原来的DMN网络的内存和输入模块的几点改进。结合这些变化,一个新的图像输入模块引入到视觉问答系统中。在DAQUAR-ALL、COCO-QA和VQA数据集上的验证了所提出方法的有效性。实验结果表明,所提出的新动态记忆模型取得了很好的结果,比一些经典深度方法都更出色。
关键词 动态记忆网络;深度学习;视觉问答
基金项目 国家自然科学基金资助项目(1801286)
国家自然科学基金项目(61701295)
本文URL http://www.arocmag.com/article/02-2020-10-031.html
收稿日期
修回日期
页码 -
中图分类号 TP391
文献标志码