Aug, 2019

基于好奇心驱动的强化学习用于多样化视觉段落生成

TL;DR本研究提出一种基于好奇心驱动的强化学习框架(CRL),旨在通过在长期决策过程中测量状态转移预测不确定性、引入由好奇心模块产生的密集的固有奖励、以及整合折扣模仿学习等方法,共同提高视觉段落生成的多样性和准确性