基于布朗桥随机过程的目标导向主动对话中的对话规划

ACLMay, 2023

基于布朗桥随机过程的目标导向主动对话中的对话规划

Dialogue Planning via Brownian Bridge Stochastic Process for Goal-directed Proactive Dialogue

Jian Wang, Dongding Lin, Wenjie Li

TL;DR提出了一种基于随机过程的连贯对话路径规划方法，使用预训练语言模型生成明确的路径并引导对话生成，实现了更高成功率和更连贯的话语。

Abstract

goal-directed dialogue systems aim to proactively reach a pre-determined target through multi-turn conversations. The key to achieving this task lies in planning dialogue paths that smoothly and coherently direct

goal-directed dialogue systems dialogue paths coherence stochastic process language models

发现论文，激发创造

面向目标的主动对话生成的目标受限双向规划

以决策理论为灵感，提出了一种新颖的目标约束双向规划方法 (TRIP)，通过生成任务规划一个适当的对话路径，然后采用该路径指导对话生成的过程，实验证明该方法显著优于各种基线模型。

Mar, 2024

面向目标的对话系统规划

本文提出了一种使用规划技术处理说明性对话代理的方法，从模型征集到生成的计划的执行，涵盖过程的所有方面，同时介绍了一种全新的计划编码方法、多种规划接口和一个强健的执行者。

Oct, 2019

像人一样规划：对话规划的双过程框架

通过引入心理学中的双过程理论，我们提出了双过程对话规划（DPDP）框架，结合直觉策略模型和深思熟虑的蒙特卡洛树搜索机制，通过线下强化学习和增强的实时学习实现了效率和策略深度之间的动态平衡，并在各种对话任务中实验证实了 DPDP 在实现高质量对话和操作效率上的卓越性。

Jun, 2024

跟随我：面向目标驱动推荐对话系统的会话规划

本文介绍了目标驱动的对话推荐系统，引入了 Target-driven Conversation Planning (TCP) 框架来规划对话，通过计划的内容来指导对话生成，试验结果表明我们的对话规划显著提高了目标驱动的推荐对话系统的性能。

Aug, 2022

战略对话的分层文本生成与规划

本论文介绍了一种学习对话信息表征、提高决策效率的方法，通过解耦对话表述中的语义和语言实现，使用学习到的表征完成对话生成、规划和增强学习等任务，在实验中效果比之前的工作更佳。

Dec, 2017

朝着具有进展意识的自主对话代理的发展

本文提出一种对话代理框架，该框架包括使用 “全局” 对话状态空间的概念、基于会话轨迹计算的任务特定进度函数和基于对话回滚的计划机制，从而让对话代理为下一步响应选择使用任务成功的话题。

May, 2022

通过自动规划生成对话代理

通过使用领域无关的 AI 规划来创建自动化的对话计划，使得具备个性化、定制化和上下文相关互动要求的更复杂多轮对话应用（如职业指导或旅行规划）得以实现。

Feb, 2019

目标驱动和视觉对话系统的全流程优化

本文介绍了一种基于深度强化学习的方法，使用策略梯度算法来优化基于任务且与视觉相关的对话，该方法在通过 Mechanical Turk 收集的 12 万个对话数据集上进行了测试，并提供了鼓舞人心的结果，可以解决生成自然对话和在复杂图像中发现特定对象的问题。

Mar, 2017

面向目标的开放域对话

本研究提出了一种基于关键词控制的方法，通过监督学习和话语级别的限制引导自然对话流向指定目标，我们通过创建增强的关键词对话数据集进行定量和人类评估，证明了我们的系统相对于其他方法可以产生有意义且有效的对话。

May, 2019

与非合作用户的交互：积极对话策略的新范式

本研究旨在提高主动对话策略在动态用户交互中的自然性和实用性，特别关注非合作用户行为，提出一种名为 I-Pro 的新解决方案，在学习目标权重方面有所创新，并在实验中取得了显著的效果和可解释性。

Apr, 2022