Apr, 2020

图像文本匹配和检索的 Transformer 推理网络

TL;DR本文介绍了使用 Transformer Encoder Reasoning Network 架构来进行图像与文本的自动匹配,以便于实现大规模信息检索。试验结果表明,本架构成功实现了该任务且获得了创新性的成果。