发布日期:2019-03-08 访问量:
人工智能与媒体计算 (AI & Media Computing) 团队关于零样本视频检索的论文被 CVPR 2019 录用。CVPR(IEEE Conference on Computer Vision and Pattern Recognition)是中国计算机学会推荐的人工智能领域A类会议。根据 Google Scholar 给出的刊物影响力统计,CVPR以H指数188,在所有计算机类刊物中排第1位。
在零样本视频检索的场景中,用户以自然语言句子的形式表达其查询需求,比如"一个蓄着大胡子的人对着麦克风讲话或唱歌"。为了解决句子和视频的跨模态表示及相似度计算问题,本文提出了一种新的对偶编码网络(dual encoding network),首次使用具有相似架构的多层编码网络同时对句子和视频进行量化编码和表示学习,在多个极具挑战性的评测集上超过了现有结果。本论文通讯作者是人工智能与媒体计算团队的李锡荣副教授。
论文信息:
Jianfeng Dong, Xirong Li*, Chaoxi Xu, Shouling Ji, Yuan He, Gang Yang, Xun Wang, Dual Encoding for Zero-Example Video Retrieval, IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2019