面向目标导向对话系统的上下文感知语言建模

Apr, 2022

面向目标导向对话系统的上下文感知语言建模

Context-Aware Language Modeling for Goal-Oriented Dialogue Systems

Charlie Snell, Sherry Yang, Justin Fu, Yi Su, Sergey Levine

TL;DR通过将目标为导向的对话形式化为部分可观测的马尔可夫决策过程，并将语言模型解释为动态和策略的表示，我们提出了一种简单有效的方法，即任务重新标记，以目标感知的方式微调语言模型，从而显著提高了任务性能，达到了人类水平的任务表现。我们还引入了一些训练策略，以更好地聚焦于手头的任务。我们使用 AirDialogue 在实际的航班预订任务上评估了我们的方法 Context-Aware Language Models（CALM），在任务成功率方面，CALM 的表现优于现有技术方法 7％。

Abstract

goal-oriented dialogue systems face a trade-off between fluent language generation and task-specific control. While supervised learning with large language models is capable of producing realistic text, how to st

发现论文，激发创造

基于预训练语言模型的任务导向对话系统研究——以GPT-2为例

本研究探讨了数据稀缺对于多领域任务导向对话系统快速发展的限制，并提出了一种基于TransferTransfo和生成模型预训练的对话模型，并在MultiWOZ数据集上进行了验证，结果显示该模型可以有效地绕过显式策略和语言生成模块来实现对于任务的导向和推理。该方法有望缓解数据稀缺问题，进而支持构建更具吸引力和更流畅的任务导向的对话代理人。

Jul, 2019

使用对话信息奖励实现目标导向的视觉对话：我应该问什么？

本文研究了目标导向的视觉对话任务，提出了一种结合强化学习和正则化信息增益的端到端目标导向视觉对话系统，并在GuessWhat？！数据集上进行了测试，取得了优于当前最先进模型的显著结果。

Jul, 2019

面向任务的对话状态生成的长上下文建模

本论文提出了一种基于TRADE的可转移对话状态生成器，结合简单有效的话语标记技术和双向语言模型的多任务学习模型，旨在解决基线性能在长对话上大幅下降的问题，最终在MultiWOZ 2.0数据集上实现了52.04％的联合目标准确性，相对提高了7.03％，成为了最新的最先进技术。

Apr, 2020

针对任务导向对话的简单语言模型

SimpleTOD采用单个因果语言模型解决任务导向的对话，具有先进的性能，并且可以完全利用预训练、开放领域的因果语言模型进行转移学习。它提高了对话状态跟踪的联合目标准确性，改善了在端到端设置中评估行动决策和响应生成的主要指标。

May, 2020

DialoGLUE：面向任务导向对话的自然语言理解基准

本文介绍了 DialoGLUE，一种公共基准，旨在鼓励对话研究的表示转移，领域自适应和样本有效任务学习。通过 DialoGLUE 基准，基线方法和评估脚本，我们希望促进发展更为通用的任务导向型对话模型。

Sep, 2020

任务导向对话系统语言模型比较研究

本研究比较了使用最新的预训练模型，如 BART 和 T5 对任务导向对话系统的端到端训练的效果和强度，实验结果表明在语言模型微调后，模型生成的响应更流畅、更准确，BART 和 T5 在 BLEU 和 F1 分数方面胜过 GPT-based models，达到了任务导向对话系统的最先进水平。

Jan, 2022

基于提示的蒙特卡罗树搜索用于面向目标的对话策略规划

提出 GDP-Zero，该方法使用 Open-Loop MCTS 进行目标导向的对话策略规划，不需要进行任何模型训练，其响应在交互式评估中被认为是 ChatGPT 的 59.32%，而在说服力方面更有优势。

May, 2023

通过前瞻目标增强大型语言模型引发的面向任务的对话系统

ProToD是一种预测未来对话动作并结合目标导向奖励信号来增强对话系统的方法，通过基于目标导向的对话模拟评估方法，可以在仅使用10%的数据的情况下实现比以前的全监督模型更好的性能，同时提高用户满意度和效率。

Sep, 2023

通过 RL 对想象中的对话进行零样本目标导向对话

通过使用强化学习进行交互式对话的目标导向任务，本研究提出利用大型语言模型生成可能的交互示例，再通过强化学习算法优化这些示例，以实现更优化的交互能力，从而在教学和偏好引导等不同目标导向对话任务中实现了最新的性能。

Nov, 2023

对话回复生成的上下文依赖指令调整

通过上下文指导生成回复的语言模型在多轮对话生成任务中取得了令人瞩目的成果，通过对指令进行微调并将其与输入对齐，可以显著提高生成性能。

Nov, 2023