ICCVJan, 2020

通过预测故事中的锚定词嵌入进行视觉叙事

TL;DR提出了一种用于视觉故事叙述任务的学习模型,其主要思想是从图片中预测锚定词嵌入,并联合使用嵌入和图片特征生成叙述句,方法设计简单,易优化,在大多数自动评估指标中取得最佳结果,在人员评估中也优于竞争方法。