CVPRApr, 2019

图像字幕的自我批判 n 步训练

TL;DR本文探讨了如何使用无参数评估器来估计图像字幕生成中的状态值,并使用重构的优势函数进行 N 步训练,这种方法相对于 MSCOCO 数据集上的序列级优势和参数化估值方法能够取得更好的性能表现。