SIGIRMay, 2021

用于外部知识视觉问答的段落检索

TL;DR本文研究了在多模态信息检索场景下,运用解析文本问题和图像进行感知的方法,探索了基于自定义大型未结构化收集文本的文本检索方法,并在此基础上构建了一个双编码器稠密信息检索模型,通过实验对模型进行了验证,得出了补充文本拓扑自动增强方法对检索结果的提升效果较为有效,密集检索方法和人工生成字幕检索方法的检索性能近似。