BriefGPT.xyz
Ask
alpha
关键词
image-caption matching
搜索结果 - 1
ICLR
基于 Transformer 的维基百科图像标题匹配多模态提议与重新排序
本文介绍了我们为参加 Kaggle 上的 Wikipedia 图像 - 字幕匹配挑战而设计的系统,该系统使用与图像相关的数据(URL 和视觉数据)来在一个庞大的字幕库中找到正确的字幕。我们提出了两个基于 Transformer 模型的级联模
→
PDF
2 years ago
Prev
Next