CVPRMar, 2023

知识图谱增强转换器用于视频字幕生成

TL;DR本文提出了一种基于知识图谱的 transformer 方法 (TextKG),分为内外两个流,外部流用于吸收额外知识、缓解长尾词等问题,内部流用于探索多模态信息以保证字幕结果质量。实验表明该方法在视觉字幕领域的四个数据集上均有较好表现。