BriefGPT.xyz
Ask
alpha
关键词
zero-shot image-set retrieval
搜索结果 - 1
ECCV
新闻故事:用视觉摘要来说明文章
该研究探索了一个新的问题,即学习对不同长度和数量的图像文本具有强鲁棒性的自我监督视觉语言表示法,其介绍了一个包括超过 31M 篇文章,22M 张图片和 1M 个视频的大规模多模态数据集,并表明最先进的图像文本对齐方法不能很好地处理带有多张图
→
PDF
2 years ago
Prev
Next