Oct, 2022

通过对比强化学习实现故事讲述的鲁棒性偏好学习

TL;DR使用对抗式生成模型和强化学习算法,本论文提出了一种新型的人工智能故事生成系统,能够根据人类喜好和偏好生成自然语言故事。