关键词computer vision systems
搜索结果 - 23
- CVPR图像与视频广告自动理解
本文提出了自动广告理解的问题,并基于两个数据集进行了研究,包含主题和情感、问题和答案、符号引用以及广告使用的最常见的说服策略等多种注释。对于多个预测任务,包括自动回答广告信息问题,我们提供了基线分类结果。
- 基于视觉化支撑的未转录语音关键词预测学习
这篇论文中,采用图像与未翻译口头说明的组合,研究计算机视觉系统是否可以用于获取语音的文本标签,并使用图片到词语多标签视觉分类器标记图像的软文本标签。然后,训练神经网络将语音映射到这些软目标。结果表明,语音识别系统能够预测话语中出现的单词,并 - 眼中的行为:动态注视数据集和学习显著性模型用于视觉识别
本研究使用人眼追踪数据结合计算机视觉,探究了视觉搜索模式的稳定性、计算机视觉的空间 - 时间兴趣点采样策略与人类注视策略之间的差异,证明人类注视可以被准确预测,且在使用先进计算机视觉实践建立端到端可训练的计算机视觉系统时表现优良。