基于工作流的任务导向对话生成

Nov, 2023

Workflow-Guided Response Generation for Task-Oriented Dialogue

Do June Min, Paloma Sodhi, Ramya Ramakrishnan

TL;DR本文提出了一种基于强化学习的新框架，用于生成与给定工作流程对齐的对话回复，通过结合 ComplianceScorer 评估指标和交互式采样技术的 RL 优化过程，评估结果表明该框架在任务导向对话系统上优于基线方法，并能生成遵循预定工作流程且自然流畅的对话回复。

Abstract

task-oriented dialogue (TOD) systems aim to achieve specific goals through interactive dialogue. Such tasks usually involve following specific workflows, i.e. executing a sequence of actions in a particular order. While prior work has focused on supervised learning methods to condition

task-oriented dialogue reinforcement learning workflow compliance compliancescorer dialogue responses

发现论文，激发创造

奖励关键之处：面向任务的对话的逐步强化学习

通过引入逐步奖励机制，我们的方法在理解和生成任务中对强化学习进行了扩展，实现了平衡优化，提高了任务导向对话系统的性能，并在包括 MultiWOZ2.0、MultiWOZ2.1 和 In-Car 在内的三个广泛使用的数据集上取得了新的最先进结果。与现有模型相比，我们的方法还展现了在低资源环境中的出色少样本能力。

Jun, 2024

MultiWOZ 是一个已解决的任务吗？带有用户模拟器的交互式 TOD 评估框架

本文提出了一种交互式评估框架用于任务指向对话（TOD）系统，通过构建用户目标的预训练模型和使用用户模拟器来交互评估，实验结果表明，我们的提议可以实现与多 WoZ 数据集中的 TOD 任务 98％的成功率和信息率，并引入了句子层和会话层得分来衡量响应质量。

Oct, 2022

对话转行动：通过动作级别生成构建面向任务的对话系统

提出了一种基于行动级别生成的任务导向对话系统，采用基于序列到序列模型的方法，将大规模对话中的每个自然语言响应表示为一系列对话行动，并将其转换为语音响应，实现了控制能力和效率之间的平衡。

Apr, 2023

TOD-Flow：任务导向对话结构建模

我们提出了一种从对话数据中推断出 TOD-Flow 图的新方法，该图可以与对话模型集成，以改善其预测性能、透明度和可控性，并且在 MultiWOZ 和 SGD 基准测试中显著提高了对话行为分类和端到端响应生成性能。

Dec, 2023

当前任务导向的对话模型能否自动化野外实际情境？

该论文讨论了针对任务的对话系统，提出了基于填槽的 TOD 系统（SF-TOD）框架的局限性，探讨了可扩展的 WebTOD 框架，后者是在 Web / 移动界面上构建对话系统的替代方向，由大规模语言模型驱动对网页 / 移动界面的理解。

Dec, 2022

通过前瞻目标增强大型语言模型引发的面向任务的对话系统

ProToD 是一种预测未来对话动作并结合目标导向奖励信号来增强对话系统的方法，通过基于目标导向的对话模拟评估方法，可以在仅使用 10% 的数据的情况下实现比以前的全监督模型更好的性能，同时提高用户满意度和效率。

Sep, 2023

面向任务的端到端对话系统的任务优化适配器

该研究提出了一种基于 Task-Optimized Adapters 和强化学习的 End-to-end TOD 系统，能够独立学习每个任务，并在 MultiWOZ 基准测试上表现出优越的性能，特别是在 2.2 数据集上的 DST 任务达到了最先进的水平。

May, 2023

低数据环境下从对话中发现工作流程

我们引入一种新的问题形式 —— 工作流程发现，提出了序列到序列方法，从对话中提取工作流程，对 ABCD 数据集进行了评估，并表明使用条件策略的模型可以改善 WD 性能。

May, 2022

面向任务导向的对话策略学习中强化学习方法的最新进展和挑战综述

本文综述了基于强化学习的对话策略学习中的最新进展和挑战，并将近期方法归类为强化学习的基本元素，以期为未来的对话管理研究提供一些启示。

Feb, 2022

使用工作流和行动计划提高任务导向对话的泛化能力

给定合法工作流名称和动作计划的对话上下文能够有效地帮助基于文本生成模型完成多步任务，但新的无法训练过的多步任务需要补充动作计划信息。

Jun, 2023