以决策理论为灵感,提出了一种新颖的目标约束双向规划方法 (TRIP),通过生成任务规划一个适当的对话路径,然后采用该路径指导对话生成的过程,实验证明该方法显著优于各种基线模型。
Mar, 2024
本文提出了一种使用规划技术处理说明性对话代理的方法,从模型征集到生成的计划的执行,涵盖过程的所有方面,同时介绍了一种全新的计划编码方法、多种规划接口和一个强健的执行者。
Oct, 2019
通过引入心理学中的双过程理论,我们提出了双过程对话规划(DPDP)框架,结合直觉策略模型和深思熟虑的蒙特卡洛树搜索机制,通过线下强化学习和增强的实时学习实现了效率和策略深度之间的动态平衡,并在各种对话任务中实验证实了 DPDP 在实现高质量对话和操作效率上的卓越性。
Jun, 2024
本文介绍了目标驱动的对话推荐系统,引入了 Target-driven Conversation Planning (TCP) 框架来规划对话,通过计划的内容来指导对话生成,试验结果表明我们的对话规划显著提高了目标驱动的推荐对话系统的性能。
Aug, 2022
本论文介绍了一种学习对话信息表征、提高决策效率的方法,通过解耦对话表述中的语义和语言实现,使用学习到的表征完成对话生成、规划和增强学习等任务,在实验中效果比之前的工作更佳。
Dec, 2017
本文提出一种对话代理框架,该框架包括使用 “全局” 对话状态空间的概念、基于会话轨迹计算的任务特定进度函数和基于对话回滚的计划机制,从而让对话代理为下一步响应选择使用任务成功的话题。
May, 2022
通过使用领域无关的 AI 规划来创建自动化的对话计划,使得具备个性化、定制化和上下文相关互动要求的更复杂多轮对话应用(如职业指导或旅行规划)得以实现。
Feb, 2019
本文介绍了一种基于深度强化学习的方法,使用策略梯度算法来优化基于任务且与视觉相关的对话,该方法在通过 Mechanical Turk 收集的 12 万个对话数据集上进行了测试,并提供了鼓舞人心的结果,可以解决生成自然对话和在复杂图像中发现特定对象的问题。
Mar, 2017
本研究提出了一种基于关键词控制的方法,通过监督学习和话语级别的限制引导自然对话流向指定目标,我们通过创建增强的关键词对话数据集进行定量和人类评估,证明了我们的系统相对于其他方法可以产生有意义且有效的对话。
May, 2019
本研究旨在提高主动对话策略在动态用户交互中的自然性和实用性,特别关注非合作用户行为,提出一种名为 I-Pro 的新解决方案,在学习目标权重方面有所创新,并在实验中取得了显著的效果和可解释性。
Apr, 2022