Oct, 2022
通过对比强化学习实现故事讲述的鲁棒性偏好学习
Robust Preference Learning for Storytelling via Contrastive Reinforcement Learning
Louis Castricato, Alexander Havrilla, Shahbuland Matiana, Michael Pieler, Anbang Ye...
TL;DR使用对抗式生成模型和强化学习算法,本论文提出了一种新型的人工智能故事生成系统,能够根据人类喜好和偏好生成自然语言故事。