Jan, 2022

朝向自学习的端到端任务导向对话系统

TL;DR本文研究了如何通过自学习的方式使得 Task Bots 自适应于动态环境,并提出了 SL-AGENT 框架,该框架包含一个对话模型和一个预训练的奖励模型,能够在无需或最小化人工标注的情况下通过强化学习在人机交互中学习,并在自动和人工评估中证明其有效性。