MMDec, 2021

基于关系图学习的视频描述生成

TL;DR本研究设计了一种新颖的关系图学习框架,包括一种语言细化的场景图表示,探索细粒度的视觉概念,并解决了对象幻觉问题。实验结果表明,本方法可以生成更精细和准确的描述。