对话转行动:通过动作级别生成构建面向任务的对话系统
本文提出了一种基于强化学习的新框架,用于生成与给定工作流程对齐的对话回复,通过结合 ComplianceScorer 评估指标和交互式采样技术的 RL 优化过程,评估结果表明该框架在任务导向对话系统上优于基线方法,并能生成遵循预定工作流程且自然流畅的对话回复。
Nov, 2023
本文介绍了一个新的基于 Dialogue Action 的 Tree-structured TaskFlow 架构来构建基于任务的聊天机器人,能够自动构建任务流并有效减轻开发人员负担,实验结果证明其能够解决先前任务导向式对话系统所面临的难以建立本体、可控性和可解释性不足以及大量数据标注需求等问题。
May, 2022
使用大型语言模型(LLMs)的上下文学习能力与业务逻辑的确定执行相结合,描述了一种构建面向任务的对话系统的系统。与主要用于行业的基于意图的 NLU 方法相比较,我们的实验表明,使用我们的系统开发聊天机器人所需的工作量明显较少,这些聊天机器人可以成功地进行复杂对话,并且我们的系统对于大规模任务导向的对话系统具有可扩展的有益特性。我们提供了我们的实现用于使用和进一步研究。
Feb, 2024
本文提出通过对话策略来规划目标响应的内容和风格,促进神经响应生成方法生成更为准确、有效和吸引人的回应,通过 Topical-Chat 数据集的自动注释,得到包括对话上下文、目标对话行为、话题信息等方面的行动计划。作者进一步调查了不同的对话策略模型来预测行动计划,证明了在句子级别和依托对话策略的生成模型所生成的回复更具适切性,并且控制效果更为出色。
May, 2020
本文介绍一种基于神经网络的端到端可训练的目标导向对话系统,以及一种新的数据收集方法,该方法基于一种新型的管道式 Wizard-of-Oz 框架。该方法可用于开发对话系统,帮助用户在餐厅搜索领域自然地交流并完成任务。
Apr, 2016
本文提出了一种基于大规模预训练模型(如 GPT-2)的任务驱动对话系统纯自然语言生成任务,以简化复杂的词语替换处理,但是直接使用会遇到对话实体不一致性和预训练模型精调时的灾难性遗忘问题,因此我们设计了一种新的 GPT-Adapter-CopyNet 网络,它将轻量级 adapter 和 CopyNet 模块融入 GPT-2,以实现更好的迁移学习和对话实体生成,而且实验结果表明,我们的方法在自动和人类评估方面的性能显著优于基线模型。
Aug, 2021
本文介绍了一种基于深度强化学习的方法,使用策略梯度算法来优化基于任务且与视觉相关的对话,该方法在通过 Mechanical Turk 收集的 12 万个对话数据集上进行了测试,并提供了鼓舞人心的结果,可以解决生成自然对话和在复杂图像中发现特定对象的问题。
Mar, 2017
提出了一个名为 MADA 的多行为数据增强框架,用于生成多样化的对话回复,该框架利用了对话的一对多属性,并改善了对话策略及回复多样性的表现。
Nov, 2019
本文探讨了任务导向对话系统的最新研究进展和挑战,特别在三个关键领域进行了深入讨论:提高数据效率、模拟多回合动态以优化任务完成性能,以及将领域本体知识与对话模型集成。此外,还评估了最近的对话进展和一些常用的语料库。我们相信,这虽然不是一个完整的调查,但它仍然可以为未来任务导向对话系统的研究提供启示。
Mar, 2020