CORAL：用于训练对话生成模型的上下文响应可检索性损失函数

May, 2022

CORAL：用于训练对话生成模型的上下文响应可检索性损失函数

CORAL: Contextual Response Retrievability Loss Function for Training Dialog Generation Models

Bishal Santra, Ravi Ghadia, Arpit Dwivedi, Manish Gupta, Pawan Goyal

TL;DR本论文提出了一种新的损失函数 CORAL 来应对交流生成任务的独特挑战，该方法可以直接优化人类喜好生成的响应，从而避免了 CE 损失的局限性，取得了比不同规模的强状态基线模型更好的效果。

Abstract

natural language generation (NLG) represents a large collection of tasks in the field of NLP. While many of these tasks have been tackled well by the cross-entropy (CE) loss, the task of dialog generation poses a

natural language generation dialog generation coral loss context-specific responses benchmark datasets

发现论文，激发创造

面向上下文语义融合的对话生成中的损失函数和评估指标

通过调查对话生成中的受限因素并提出语义注入上下文对话（SemTextualLogue）损失函数，本研究引入了新的目标函数和评估指标。在两个对话语料库上的实验表明，使用 SemTextualLogue 损失训练的对话生成模型在定量和定性评估上表现出更好的性能，相较于传统的交叉熵损失函数以及其他评估指标。

Sep, 2023

利用自动会话评估器实现连贯和引人入胜的口语对话响应生成

本研究提出一个评估聊天机器人响应的系统，利用明确的反馈机制改进神经响应图生成模型，从而获得更具连续性和参与度的响应。

Apr, 2019

通过多级对比学习增强对话生成

本文提出了一种多层对比学习模型，用于模拟回复的细粒度质量。通过设计一个排名感知校准网络和关键词知识推断组件，提高响应的相关性和多样性。实验结果表明，与基线模型相比，该模型能够生成更相关且多样化的回复。

Sep, 2020

针对对话响应选择任务的基于提示的负面响应生成

本研究提出了一种使用大规模语言模型生成对抗性负面响应的简单而高效的方法，用于提高在检索式对话系统中响应选择模型的识别能力，并证明其在对话选择任务中优于其他对抗性负面响应合成方法。

Oct, 2022

多层自适应对比学习在对话生成中的知识内化

通过使用外部知识补充上下文，知识感知对话生成旨在减轻文本退化问题，然而，模型经常无法以人类方式将这些信息内化为响应，而仅简单地将所提供的知识片段插入到通用响应中，导致生成的响应往往乏味、不连贯且缺乏互动性，这意味着退化问题仍未解决。在这项工作中，我们首先发现，这种复制式退化主要是由于弱似然目标，这使得模型可以通过仅基于重叠的表面模式匹配来 “欺骗” 这个目标而复制知识片段。为了克服这一挑战，我们提出一种多级自适应对比学习（MACL）框架，该框架动态采样负例，并随后在令牌级别和序列级别上惩罚退化行为。广泛的实验验证了我们的方法在 WoW 数据集上的有效性以及在各种预训练模型上的适用性。

Oct, 2023

重新关注相关性：自然语言生成中的个性化

本文主要讨论了自然语言生成在设计用户文本生成任务时如何利用上下文和相关性，并探讨了这种个性化文本生成可能带来的潜在风险和通过价值敏感设计应对这些挑战的途径。

Sep, 2021

生成对抗性负面回复以提升响应排名与评估的鲁棒性

发展神经对话模型需要超越 “内容相似性”，本文提出用对抗性负面样本提高模型的实用性。实验表明，我们的方法在多个数据集上均表现优异。

Jun, 2021

可信度排序的学习

通过采用基于边界的损失，研究者展示了上下文编码策略的改进方式，在一系列共享的自然语言理解任务中取得了更好的表现。

Jun, 2019

面向任务的对话系统的上下文感知对话重新排序

提出了一种上下文感知的对话响应重新排序系统，使用神经词嵌入模型和手工或逻辑回归模型，将响应在与当前对话上下文的匹配分数和候选人的概率分布的基础上重新排名，提高了最近提出的端到端任务导向对话系统在具有语音识别错误的实际对话中的性能。

Nov, 2018

开放域对话响应选择的系统评估

本研究对开源聊天机器人的多种回复生成方法进行了系统评估，提出了利用手动注释筛选出的多个正向回复和负向回复，从而提高模型效果的新训练数据，并实验证明性能较之采用对抗训练数据有更显著提升。

Aug, 2022