关键词large-scale training dataset
搜索结果 - 2
- ICCV从数百万个叙述视频中学习回答问题
本研究提出了一种使用自动跨模态监督和问题生成转换器生成问题和答案对的方法来生成大规模视频问答训练数据集,并提出了一种基于对比损失的训练程序来处理其多样的答案类型。通过实验证明,在 MSRVTT-QA、MSVD-QA、ActivityNet- - ICCV无约束前景目标搜索
本文提出了一种解决图像编辑中寻找前景对象的技术 —— 无约束前景物体搜索,并介绍了一种支持通过将背景图像与前景对象进行编码来进行高效搜索的解决方案。通过创建具有不同语义类别的多个前景对象的大型训练数据集,我们的无约束前景物体搜索解决方案优于