MMAug, 2021

类似场景引发类似情感:用于风格化图像字幕生成的并行数据增强

TL;DR该论文提出了一种新的数据扩增框架来实现语义相关、风格一致的图像描述生成,在以往仅使用无监督学习方法来进行风格生成的基础上,利用情感词组从小规模缩影句子中提取风格语言,将其与大规模事实描述相结合,采用多模式场景检索和情感感知式生成器生成一系列分别各异、口语化的描述。实验证明,该方法能够有效缓解数据稀缺的问题,同时在句子相关性和时尚性等方面都显着超越了现有技术方法的最新水平。