《计算机应用研究》|Application Research of Computers

基于多尺度特征映射匹配的图像表示方法

Multi-scale feature map matching for image representation

免费全文下载 (已被下载 次)  
获取PDF全文
作者 朱杰,吴树芳
机构 1.中央司法警官学院 信息管理系,河北 保定 071000;2.河北大学 管理学院,河北 保定 071000
统计 摘要被查看 次,已被下载
文章编号 1001-3695(2020)09-063-2866-05
DOI 10.19734/j.issn.1001-3695.2019.05.0164
摘要 在卷积神经网络模型中,空间金字塔池化方法将空间信息融入到深度特征的生成过程中,最终生成的图像表示可以有效地用于提高图像检索性能,但是此方法会导致生成的图像表示中不同维度之间描述的信息存在重复,且相同维度描述的图像内容不匹配。为此提出了一种基于多尺度特征映射匹配(multi-scale feature map matching,MFMM)的图像表示方法。此方法首先利用深度特征的方差与协方差矩阵提出了一种特征映射选择算法,用于增强图像表示中不同维度特征的独立性。其次,依据相同通道特征映射中高响应值位置有较高匹配性的特点,结合激活映射中最大响应位置的深度特征提出了一种优化的特征映射中心点选择方法。最后,按照不同的中心点通过多尺度窗口采样的方式,从特征映射中提取出带有空间信息的深度特征用于表示图像内容。实验结果表明,提出的方法在图像检索任务中能够取得良好的效果。
关键词 空间金字塔; 响应匹配; 多尺度窗口; 图像表示
基金项目 国家自然科学基金资助项目(61802269)
河北省自然科学基金青年基金资助项目(F2018511002)
中央司法警官学院校级科研项目(XYZ201602)
河北省高等学校科学技术研究项目(Z2019037)
河北大学中西部提升综合实力专项
河北大学高层次创新人才科研启动经费项目
河北省高等学校科学技术研究青年基金项目(QN2018251)
河北省高等学校科学研究项目青年基金项目(QN2018084)
本文URL http://www.arocmag.com/article/01-2020-09-063.html
英文标题 Multi-scale feature map matching for image representation
作者英文名 Zhu Jie, Wu Shufang
机构英文名 1.Dept. of Information Management,National Police University for Criminal Justice,Baoding Hebei 071000,China;2.College of Management,Hebei University,Baoding Hebei 071000,China
英文摘要 Spatial pyramid pooling method integrates spatial information into the generation of deep features based on the convolutional neural network, and the corresponding image representation can effectively enhance the retrieval performance. However, spatial pyramid pooling method causes the information described between the different dimensions in the image representations duplicated and the image contents described by the same dimension unmatched. This paper proposed a multi-scale feature map matching(MFMM) based image representation. First, it proposed a feature map selection algorithm which used the variance and covariance matrix of deep features, so as to improve the independence of different dimensions in image representation. Second, according to the characteristic that the high response value positions in the same feature maps of the same channel had higher matching score, it proposed an optimal feature map center selection method based on the deep feature with the maximum response in the activation map. Finally, it extracted deep features with spatial information according to the selected centers and multi-scale windows sampling for representing images. The experimental results demonstrate that the proposed method achieves excellent results in image retrieval tasks.
英文关键词 spatial pyramid; response matching; multi-scale windows; image representation
参考文献 查看稿件参考文献
 
收稿日期 2019/5/6
修回日期 2019/6/30
页码 2866-2870
中图分类号 TP391
文献标志码 A