Mar, 2020

任意定制:使用抽象场景图精细控制图像字幕生成

TL;DR提出了一种基于 Abstract Scene Graph 结构的 ASG2Caption 模型,通过识别图形中的用户意图和语义,生成用户想要的注释,进而实现更好的可控性和注释多样性。