Jun, 2017

序列型演员 - 评论家算法在图像字幕生成中的应用

TL;DR本研究探究了基于 actor-critic 强化学习的图像标题生成模型的训练方法,通过计算每个 token 的优势和值实现直接优化语言质量指标,取得了在 MSCOCO 数据集上的最先进性能。