Aug, 2023

ADS-Cap: 一个准确且多样化的风格化说明文档生成框架,无需成对的风格化语料库

TL;DR使用不成对的文体语料库生成具有特定语言风格的视觉 grounded 图片标题是一项具有挑战性的任务,本文提出了一种新的框架(ADS-Cap)来生成准确且多样化的文体标题,其中使用对比学习模块来统一成对的事实语料库和不成对的文体语料库,并使用条件变分自动编码器在潜空间中自动记忆多种文体模式以增强多样性,并通过简单而有效的重新检查模块提高文体准确性。在两个广泛使用的文体图片标题数据集上进行的实验结果表明,相比多种基准模型,ADS-Cap 在与图片一致性、文体准确性和多样性方面表现出了出色的性能。最后,我们进行了广泛的分析以了解我们方法的有效性。