EMNLPOct, 2022

沟通失效:人类和神经字幕之间的低互通性

TL;DR该研究比较了神经视觉检索器基于人工和神经式生成的图片描述符的 0-shot 检索性能表现,并通过对 ImageCoDe 数据集进行实验,发现神经式生成的描述符表现更好,这表明神经模型在生成描述符方面的语言形式与英语相似,但是这种表面上的相似可能是深度误导性的。