使用多维建模适应新动作集的对话策略调整

Apr, 2022

使用多维建模适应新动作集的对话策略调整

Dialogue Strategy Adaptation to New Action Sets Using Multi-dimensional Modelling

Simon Keizer, Norbert Braunschweiler, Svetlana Stoyanchev, Rama Doddipatla

TL;DR使用多维方法对话管理加速训练，通过预先训练的任务无关策略来实现转移学习，从而在有限的训练数据下实现更好的性能，人工用户评估表明多维系统（针对目标情境的有限训练数据进行适应）比一维基准（在同样的训练数据上不进行适应）提高了 7％的成功率。

Abstract

A major bottleneck for building statistical spoken dialogue systems for new domains and applications is the need for large amounts of training data. To address this problem, we adopt the multi-dimensional approach

statistical spoken dialogue systems multi-dimensional approach transfer learning policy optimization user evaluation

发现论文，激发创造

可迁移的对话系统和用户模拟器

通过对话系统和用户模拟器之间的交互，开发了一种建模框架，旨在通过自动对话场景的创建来解决训练数据不足的问题，并使用强化学习来改进智能体的行为，从而在转移学习中提高对话系统性能。

Jul, 2021

三思而后言：通过计划单次对话来改善多次对话策略

本文提出了一种基于多任务学习框架的 Planning Enhanced Dialog Policy (PEDP) 方法，使用模型规划来模拟单动作对话，从而增强多动作预测，实现了相对于现有状态下最先进方法的 3% 提高，达到了 90.6% 的可靠任务成功率。

Apr, 2022

利用明确的过程说明来提高数据效率的行动预测

本文提出了一种数据高效的解决方案，将知识检索模块与大型语言模型相结合，利用代理指南中的显式指令构建对话系统，并通过半监督预训练方案进行训练，同时评估在行动状态跟踪和工作流发现两个对话任务中的表现，结果表明程序化知识增强提高了在低数据密度下的准确性。

Jun, 2023

检索与记忆：使用多动作记忆的对话策略学习

本研究提出了一种 “检索和记忆” 框架，该框架首先使用神经上下文感知检索模块从训练集中检索多个候选系统操作，然后使用存储增强的多解码器网络在候选操作的条件下生成系统操作的方法，该方法能降噪自适应选择候选操作中的关键信息。实验表明该方法在上下文到回应生成任务中具有竞争力。

Jun, 2021

任务导向式对话的多动作策略建模

本文比较了多种模型在预测每个对话回合多个 Dialog Management 决策动作方面的性能，并提出了一种基于 gCAS 模型的新策略模型，实验结果表明 gCAS 模型优于其他模型。

Aug, 2019

基于分层强化学习的对话管理子域建模

本文提出在多领域对话管理中使用分层强化学习和选项框架的方法，并且与现有平面方法相比学习速度更快且得到更好的结果，同时展示预训练策略如何适应更复杂的对话系统并为更复杂的多领域对话系统提供政策优化的可能性。

Jun, 2017

面向多领域和多任务对话的少样本结构化策略学习

本研究旨在探讨使用结构化政策提高在多领域和多任务环境下的强化学习样本效率。作者在测试不同结构化水平时，发现图形神经网络具有优势，且建议未来的研究应聚焦于连接人类数据、模拟器和自动评估器。

Feb, 2023

多模态开放领域对话

本文旨在研究结合先进的开放域对话代理和视觉模型，以实现多模态对话的目标，研究不同的图像融合方案和域自适应预训练和微调策略，并展示了我们最好的模型不仅在多模态对话方面优于现有的强模型，而且在纯文本对话方面表现也和其前身 BlenderBot 一样好，同时我们还研究并整合了安全组件，展示这种努力不会削弱模型性能方面的吸引力度量。

Oct, 2020

考虑同一上下文下多个适当回复的任务导向型对话系统

提出了一个名为 MADA 的多行为数据增强框架，用于生成多样化的对话回复，该框架利用了对话的一对多属性，并改善了对话策略及回复多样性的表现。

Nov, 2019

LaDA：用于零样本跨语言神经网络语言建模的潜在对话动作

这篇论文提出了一种新的 LaDA 模型，在跨语言自适应的语音理解系统中使用潜在对话动作层来优化解码策略，以提高对复杂多语言意图和槽值的处理能力，并在零样本和少样本适应方面取得了最先进的结果。

Aug, 2023