Apr, 2023

AToMiC: 支持多媒体内容创作的图像 / 文本检索测试集

TL;DR介绍了 ATOMIC 数据集,旨在推进图像 / 文本跨模态检索的研究。该数据集采用多层次结构和不同域的文本、样式和图像类型,以及嵌入维基百科的大规模图像 - 文档关联性,构建了一种适应真实用户模型的检索测试集合,提供了可扩展、多样化、可重复制的多媒体检索研究的试验基础。