推荐系统作为一种通信游戏:自监督机器人游戏用于目标导向性对话
本文提出一种个性化的端到端模型,以应用个性化技术来解决对话系统中的一些悬而未决的问题。该模型结合了 “个人资料模型” 和 “偏好模型” 两个子模型,并实践证明其在对话系统任务完成率和用户满意度等方面取得了良好表现。
Nov, 2018
我们提出了一种新颖的基于 AI 的聊天机器人学习模式,用户通过与教师机器人的对话获取信息和知识。我们的系统使用了一种新型加强自我对话模式,在不同领域之间实现知识传递和关注用户的对话。我们在三个大型公共数据语料库上进行了广泛的主客观评估,证明了我们的系统在传递知识和关注用户方面的有效性,帮助用户在不阅读文章的情况下大大提高知识水平。
May, 2022
本文介绍了一种基于深度强化学习的视觉问答和对话代理训练方法,通过协作游戏中的自然语言对话,演示了 'visual' 对话代理具有自主创建基于视觉属性的语言和沟通的能力,并发现强化学习有助于代理人的团队合作,促进信息交流和提高效率。
Mar, 2017
本研究提出了一种基于关键词控制的方法,通过监督学习和话语级别的限制引导自然对话流向指定目标,我们通过创建增强的关键词对话数据集进行定量和人类评估,证明了我们的系统相对于其他方法可以产生有意义且有效的对话。
May, 2019
本文设计了一个目标导向的交互式系统,儿童可以通过诸如 “见面打招呼” 和 “Simon 说” 游戏等一系列交互活动与代理互动。研究人员探索了各种特征提取器和模型,以提高意图识别精度,并借助注意力模型等新颖的方式利用先前的用户和系统互动来进行对话适应,从有限的训练数据中引导学习的模型具有更好的性能。
Dec, 2019
本文研究了如何通过自学习的方式使得 Task Bots 自适应于动态环境,并提出了 SL-AGENT 框架,该框架包含一个对话模型和一个预训练的奖励模型,能够在无需或最小化人工标注的情况下通过强化学习在人机交互中学习,并在自动和人工评估中证明其有效性。
Jan, 2022
该研究论文介绍了用于电影预订领域的用户模拟器,它利用规则和收集到的数据,并支持电影票预订和电影寻找两个任务。为了实现对对话框架的经验算法比较,论文提出了一种新的模拟框架,展示了多个代理的思路,并详细介绍了将自己的代理添加到所提出的框架中进行测试的过程。
Dec, 2016
本文探讨了使用增强学习的方式,通过与人类交互并接受其反馈来提高对话代理的能力,模拟了在人工环境中的各种学习情况,介绍了适用于此类学习的模型,并通过机械土耳其实验验证了此方法。
Nov, 2016