Mar, 2024

TARN-VIST: 面向视觉叙事的主题感知强化网络

TL;DR通过使用主题感知的增强学习网络,我们提出了一种新的方法来生成更连贯和相关的视觉叙事故事。实验结果表明,我们的模型在多个评估指标上优于大多数竞争模型。