1
基于多模态融合的城市道路场景视频描述模型研究
Multimodal fusion for video captioning on urban road scene
2023年第2期 : 607-611,640
doi:10.19734/j.issn.1001-3695.2022.06.0275