开放域对话响应选择的系统评估

Aug, 2022

A Systematic Evaluation of Response Selection for Open Domain Dialogue

Behnam Hedayatnia, Di Jin, Yang Liu, Dilek Hakkani-Tur

TL;DR本研究对开源聊天机器人的多种回复生成方法进行了系统评估，提出了利用手动注释筛选出的多个正向回复和负向回复，从而提高模型效果的新训练数据，并实验证明性能较之采用对抗训练数据有更显著提升。

Abstract

Recent progress on neural approaches for language processing has triggered a resurgence of interest on building intelligent open-domain chatbots. However, even the state-of-the-art neural chatbots cannot produce

neural approaches open-domain chatbots response ranking/selection training data state-of-the-art methods

发现论文，激发创造

通过响应选择评估对话生成系统

本研究提出了一种构建响应选择测试集以进行系统评估的方法，通过过滤不相关的和可接受的候选者，实验表明此方法比 BLEU 等自动评估指标更能与人类评估相关联。

Apr, 2020

生成对抗性负面回复以提升响应排名与评估的鲁棒性

发展神经对话模型需要超越 “内容相似性”，本文提出用对抗性负面样本提高模型的实用性。实验表明，我们的方法在多个数据集上均表现优异。

Jun, 2021

针对对话响应选择任务的基于提示的负面响应生成

本研究提出了一种使用大规模语言模型生成对抗性负面响应的简单而高效的方法，用于提高在检索式对话系统中响应选择模型的识别能力，并证明其在对话选择任务中优于其他对抗性负面响应合成方法。

Oct, 2022

面向任务的对话系统中神经响应选择的训练

通过在大型通用领域对话语料库上预训练反应选择模型，然后利用小型特定领域数据微调预先训练的模型，本论文提出了一种有效的方法来部署任务导向对话中的响应选择，取得了很好的效果。在六个不同的应用领域，从电子商务到银行业，本方法都表现出了良好的效果。

Jun, 2019

社交对话的神经响应排名：一种数据高效的方法

本文提出了使用神经排序器从未标记的数据中有效地训练社交对话系统的方法，并展示了使用该方法通过优化长度作为目标的排序器在性能上优于优化用户评级的排序器，从而可简化未来社交对话代理的数据收集。

Nov, 2018

利用自动会话评估器实现连贯和引人入胜的口语对话响应生成

本研究提出一个评估聊天机器人响应的系统，利用明确的反馈机制改进神经响应图生成模型，从而获得更具连续性和参与度的响应。

Apr, 2019

构建抗干扰多轮响应选择模型的评估数据集和策略

本研究分析了开放域韩语多次对话响应选择模型的弱点，并发布了对抗性数据集以评估这些弱点。我们还提出了在这种对抗环境中构建强大模型的策略。

Sep, 2021

面向任务的对话系统的上下文感知对话重新排序

提出了一种上下文感知的对话响应重新排序系统，使用神经词嵌入模型和手工或逻辑回归模型，将响应在与当前对话上下文的匹配分数和候选人的概率分布的基础上重新排名，提高了最近提出的端到端任务导向对话系统在具有语音识别错误的实际对话中的性能。

Nov, 2018

基于 Transformer 的开放领域口语对话响应评估器

该研究对基于多个响应生成器的开放域对话系统进行了实验，使用了多种响应排序方法比较 Athena-Heuristic 和 Athena-RR，结果显示 Athena-RR 表现最好，能够在对话中更准确地选择最佳响应。

Feb, 2023

对话系统中选择相应生成知识的学习

该论文提出了一种采用先验和后验知识分布来实现知识选择的端到端神经模型，以更好地将适当的知识整合到响应生成中。

Feb, 2019