Apr, 2022

CHAI: 一种基于离线强化学习的面向任务型对话的聊天机器人 AI

TL;DR本文讨论使用离线强化学习代替在人类对话中的试错学习来训练对话代理,结果表明最近发展的离线强化学习与语言模型相结合可以产生更好地实现任务目标的逼真对话代理。