Mar, 2022

具有组内语义的知识增强注意力网络用于视觉叙事

TL;DR提出了一种基于知识增强的注意力网络,采用分组语义模型,能够生成比现有方法更合理和流畅的多模态视觉叙事,并在客观和主观评估指标上显示出优越性能。