无需平行数据的有礼貌对话生成

ACLMay, 2018

Polite Dialogue Generation Without Parallel Data

Tong Niu, Mohit Bansal

TL;DR本文提出了三个用弱监督模型生成有礼貌或粗鲁对话响应的模型，分别是混合模型（Fusion）、标签微调模型（LFT）和强化学习模型（Polite-RL），并且这三个模型可以在没有平行数据的情况下执行。同时，本研究还比较了两种基于检索的有礼貌的对话模型，通过人工评估，结果表明 LFT 和 Polite-RL 模型可以显著地产生更有礼貌的响应，同时又不会牺牲对话质量。

Abstract

Stylistic dialogue response generation, with valuable applications in personality-based conversational agents, is a challenging task because the response needs to be fluent, contextually-relevant, as well as paralinguistically accurate. Moreover, parallel datasets for regular-to-stylis

dialogue response generation politeness weakly-supervised models reinforcement learning context-relevance

发现论文，激发创造

注意你的语气：介绍一个敬语改写的新数据集

介绍了 PoliteRewrite 数据集，其中包括 10K 个人工标注和 GPT-3.5 协作标注的礼貌语言改写句子和 100K 个 GPT-3.5 自动生成的高质量礼貌句子改写，旨在为更具挑战性的句子改写研究做出贡献，并提出资源注释范式方面与预训练模型的协作思路。

Dec, 2022

礼貌转换：标注与生成方法

本文提出了一种新的礼貌转化任务，旨在将非礼貌语句转化为礼貌性语句并维持原意。我们提供了一个包含 1.39 多个自动标记有礼貌度的数据集，以鼓励对这一新任务进行基准评估。我们设计了一个标记生成管道，识别出风格属性，然后生成目标风格的句子，同时保留了源内容的大部分信息。对于礼貌性以及其他五个转移任务，我们的模型在内容保留的自动度量标准上优于现有技术，同时在风格转换准确性方面具有可比或更好的表现。此外，我们的模型在语法正确性、意义保留和转移准确性的人类评估方面优于现有方法的六个风格转移任务的所有。数据和代码位于此 https URL。

Apr, 2020

即插即用式对话模型

本文介绍了一种新的控制对话响应生成的方法 —— 插入式方法，其不需要注释对话数据集或精调大规模语言模型，并可以实现高度控制所生成的会话响应的多个方面。

Oct, 2020

针对对话响应选择任务的基于提示的负面响应生成

本研究提出了一种使用大规模语言模型生成对抗性负面响应的简单而高效的方法，用于提高在检索式对话系统中响应选择模型的识别能力，并证明其在对话选择任务中优于其他对抗性负面响应合成方法。

Oct, 2022

利用 LLM 代理生成合成对话数据集

通过目标导向的对话式代理生成线性对话样本，实现与用户的对话以获取所需的线性模型信息，并通过人工和自动评估，包括使用 GPT-4 模仿人工评估指标的评估方法，验证对话的高质量性。

Jan, 2024

使用风格化非成对文本生成风格化对话回应

本研究提出一种基于逆向对话模型和风格路由方法的对话生成技术，能够捕捉嵌入在不成对文本中的风格特征，产生既符合给定上下文又符合目标风格的对话回复，实验表明方法能够胜过竞争性对话系统在产生连贯、风格强烈的对话回复方面的表现。

Sep, 2020

利用释义生成快速启动对话系统

该研究提出了一种基于改写生成的方法，可以减少创建新对话代理所需要的时间和成本，同时提高其性能，使其能够实际与真实用户进行交互。实验证明该方法提高了意图分类模型的泛化能力，有助于在组织范围内规模化部署这项技术。

Apr, 2022

基于预训练的个性化对话生成模型及面向稀疏信息处理

本文提出了一种基于预训练的个性化对话模型，利用个人属性嵌入来丰富对话语境，结合注意力路由结构进行解码，从而生成更为连贯且人物一致的回答。

Nov, 2019

借助大语言模型生成忠实的以人为基础的对话数据集

通过建立 Generator-Critic 架构，使用 LLM 生成会话，借助 Synthetic-Persona-Chat 评估了高质量对话数据集对 NLP 模型的影响。

Dec, 2023

多方响应生成与关系解缠

该研究提出了一种通过对话上下文进行关系推理来指导神经响应生成的方法，并在多方对话中展示出优于基线模型的效果。

Mar, 2024