Jan, 2021

图像描述生成的宏观控制

TL;DR本论文提出了两种新方法来改善图像字幕模型的多样性、可控性和句子生成质量,并使用图像文本匹配模型来选择更好的句子。实验结果表明,这些方法可以显著提高模型的性能。