Apr, 2018

没有完美的度量标准:基于对抗性奖励学习的视觉叙事

TL;DR通过 Adversarial REward Learning 框架从人类示范中学习隐式奖励函数,并通过学习后的奖励函数优化策略搜索,提高在生成抽象故事方面的表现,尤其在人类评估中相比最先进系统,取得了显著进步。