成交还是放弃?端到端学习的谈判对话
研究了对话决策问题的一个类别,其中 AI 助手与一个或多个人通过自然语言协作,帮助他们做出复杂的决策。为不同的任务建立了对话环境,并使用这些环境收集了人与人的对话作为基线,同时提出了模型在决策导向的对话中面临着一些挑战,并释放了环境作为未来建模工作的测试基地。
May, 2023
本文介绍一种基于神经网络的端到端可训练的目标导向对话系统,以及一种新的数据收集方法,该方法基于一种新型的管道式 Wizard-of-Oz 框架。该方法可用于开发对话系统,帮助用户在餐厅搜索领域自然地交流并完成任务。
Apr, 2016
本文提出一种基于自然语言的交易协商机制,使用层次对话行为和监督学习、强化学习或领域特定知识对策略进行灵活设置,并利用检索式生成来维持上下文感知性和产生多样化话语。结果表明我们的系统比之前的方法具有更高的任务成功率和更类人的谈判行为。
Aug, 2018
探索预测谈判中两个重要的主观目标 - 结果满意度和合作方感知的情感属性,分析情感属性在预测中的作用,并研究了三个情感维度:表情符号、词汇和语境,以设计适应性的谈判代理人。
Jul, 2021
本文提出了一种混合式学习方法以通过在线用户交互来训练任务导向型对话系统,该方法包括强化学习和模仿学习,通过神经网络来优化并能够从用户教学中进行学习。实验结果表明,该端到端对话代理能够有效地学习并通过用户反馈了解自己的错误,并在模仿学习阶段之后应用强化学习提高完成任务的能力。
Apr, 2018
该研究提出了一种可端到端训练的神经目标导向对话系统方法,能通过智能地将对话转移给人工服务代理来处理新用户行为。该方法的三个目标是:最大化用户任务成功率,最小化对人工服务代理的负担,并通过人工代理的反馈进行在线学习,以进一步减轻其负担。实验结果表明所提出的方法能够有效实现这些目标。
Jul, 2019
本文提出了基于电影领域的一套新任务套件,旨在测试模型回答事实性问题、提供个性化、进行短对话及在 Reddit 上执行自然对话的能力,评估了各种模型在这些任务上的性能表现。
Nov, 2015
本文介绍了一种基于深度强化学习的方法,使用策略梯度算法来优化基于任务且与视觉相关的对话,该方法在通过 Mechanical Turk 收集的 12 万个对话数据集上进行了测试,并提供了鼓舞人心的结果,可以解决生成自然对话和在复杂图像中发现特定对象的问题。
Mar, 2017
本文提出了一个测试平台,以研究在特定场景下 end-to-end 对话系统的性能,通过实验比较其与手工设计的系统的相似性及差异性。结果表明,end-to-end 系统基于记忆网络能够实现目标,但仍存在缺陷。
May, 2016