推荐系统作为一种通信游戏：自监督机器人游戏用于目标导向性对话

EMNLPSep, 2019

推荐系统作为一种通信游戏：自监督机器人游戏用于目标导向性对话

Recommendation as a Communication Game: Self-Supervised Bot-Play for Goal-oriented Dialogue

Dongyeop Kang, Anusha Balakrishnan, Pararth Shah, Paul Crook, Y-Lan Boureau...

TL;DR本文介绍了一种基于交互式对话的推荐系统，通过人机对话的形式帮助用户更精准地寻找符合需求的电影，并且提供了相关数据集和代码。

Abstract

Traditional recommendation systems produce static rather than interactive recommendations invariant to a user's specific requests, clarifications, or current mood, and can suffer from the cold-start problem if their tastes are unknown. These issues can be alleviated by treating recommendation as an →

interactive dialogue recommendation system goal-driven recommendation dialogue dataset end-to-end dialogue system

发现论文，激发创造

基于迁移学习的目标驱动聊天机器人对话管理引导

本文使用迁移学习方法改善目标导向聊天机器人的高质量训练数据的不足，以提高其成功率，并展示该方法与其他处理方法的综合应用可取得最佳结果。

Feb, 2018

个性化端到端目标导向对话学习

本文提出一种个性化的端到端模型，以应用个性化技术来解决对话系统中的一些悬而未决的问题。该模型结合了 “个人资料模型” 和 “偏好模型” 两个子模型，并实践证明其在对话系统任务完成率和用户满意度等方面取得了良好表现。

Nov, 2018

对话式学习：以信息获取为强化目标的对话系统

我们提出了一种新颖的基于 AI 的聊天机器人学习模式，用户通过与教师机器人的对话获取信息和知识。我们的系统使用了一种新型加强自我对话模式，在不同领域之间实现知识传递和关注用户的对话。我们在三个大型公共数据语料库上进行了广泛的主客观评估，证明了我们的系统在传递知识和关注用户方面的有效性，帮助用户在不阅读文章的情况下大大提高知识水平。

May, 2022

使用深度强化学习学习协作视觉对话代理

本文介绍了一种基于深度强化学习的视觉问答和对话代理训练方法，通过协作游戏中的自然语言对话，演示了 'visual' 对话代理具有自主创建基于视觉属性的语言和沟通的能力，并发现强化学习有助于代理人的团队合作，促进信息交流和提高效率。

Mar, 2017

面向目标的开放域对话

本研究提出了一种基于关键词控制的方法，通过监督学习和话语级别的限制引导自然对话流向指定目标，我们通过创建增强的关键词对话数据集进行定量和人类评估，证明了我们的系统相对于其他方法可以产生有意义且有效的对话。

May, 2019

目标导向对话中意图建模、策略制定和响应调整

本文设计了一个目标导向的交互式系统，儿童可以通过诸如 “见面打招呼” 和 “Simon 说” 游戏等一系列交互活动与代理互动。研究人员探索了各种特征提取器和模型，以提高意图识别精度，并借助注意力模型等新颖的方式利用先前的用户和系统互动来进行对话适应，从有限的训练数据中引导学习的模型具有更好的性能。

Dec, 2019

朝向自学习的端到端任务导向对话系统

本文研究了如何通过自学习的方式使得 Task Bots 自适应于动态环境，并提出了 SL-AGENT 框架，该框架包含一个对话模型和一个预训练的奖励模型，能够在无需或最小化人工标注的情况下通过强化学习在人机交互中学习，并在自动和人工评估中证明其有效性。

Jan, 2022

任务完成对话用户模拟器

该研究论文介绍了用于电影预订领域的用户模拟器，它利用规则和收集到的数据，并支持电影票预订和电影寻找两个任务。为了实现对对话框架的经验算法比较，论文提出了一种新的模拟框架，展示了多个代理的思路，并详细介绍了将自己的代理添加到所提出的框架中进行测试的过程。

Dec, 2016

人机对话学习

本文探讨了使用增强学习的方式，通过与人类交互并接受其反馈来提高对话代理的能力，模拟了在人工环境中的各种学习情况，介绍了适用于此类学习的模型，并通过机械土耳其实验验证了此方法。

Nov, 2016

深度会话推荐

本文提供了一个名为 ReDial 的可用于公共研究的数据集，用于探索使用神经网络和深度学习技术创建对话系统的应用，并探讨了在这一领域中应用的新方法和机制。

Dec, 2018