通过少量专家示范融合奖励函数，实现忠实准确的知识导向对话生成

Nov, 2023

通过少量专家示范融合奖励函数，实现忠实准确的知识导向对话生成

Blending Reward Functions via Few Expert Demonstrations for Faithful and Accurate Knowledge-Grounded Dialogue Generation

PDF

Wanyu Du, Yangfeng Ji

TL;DR开发值得信赖的对话式信息搜索系统依赖于能够基于相关知识文本生成忠实准确响应的对话模型。我们通过引入一种新的奖励函数利用强化学习算法来克服数据偏见和冗余信息的两个主要挑战，并在两个对话式信息搜索数据集上的实证实验中展示了我们的方法可以与其他强大的监督学习基准相竞争。

Abstract

The development of trustworthy conversational information-seeking systems relies on dialogue models that can generate faithful and accurate responses based on relevant →

trustworthy conversational information-seeking systems dialogue models knowledge texts data biases reinforcement learning algorithms

发现论文，激发创造

通过可控特征提高基于知识的对话的准确性

研究知识基础对话系统，控制生成神经对话模型，加入不同的评估措施作为样式控制以鼓励模型生成有据可依的响应，并通过人类评估研究判断控制生成模型的产出通常更加客观和有据可依。

Jul, 2021

通过知识增强和对齐提升基于知识的对话系统的事实一致性

PLMs 基于知识驱动的对话系统存在生成与提供的知识源不一致的回应问题，本文通过知识增强和对齐两种方法有效提升了前馈网络（FFNs）在回应中表达事实知识的能力，验证了提升知识驱动对话系统的事实一致性的有效性。

Oct, 2023

提高回复和角色真实事实之间的事实一致性

通过增加奖励机制，使用强化学习方法来提高响应与用户角色特征事实之间的一致性，从而促进神经模型的响应生成能力。

Apr, 2020

通过多级对比学习增强对话生成

本文提出了一种多层对比学习模型，用于模拟回复的细粒度质量。通过设计一个排名感知校准网络和关键词知识推断组件，提高响应的相关性和多样性。实验结果表明，与基线模型相比，该模型能够生成更相关且多样化的回复。

Sep, 2020

基于预训练语言模型的知识驱动对话生成

我们使用预训练的语言模型来研究基于知识的对话生成，通过知识选择模块和无监督方法来优化知识选择和响应生成，实验结果表明，我们的模型在自动评估和人类判断方面都显著优于现有方法。

Oct, 2020

智能友好的对话代理：基于知识和角色认知的应用

本论文提出了一种有效的对话代理，同时考虑外部知识和个性，通过检索增强生成和知识个性增强查询来生成话语，实现了更少幻觉和更有吸引力的对话，在自动指标上的基于个性和知识的对话任务达到了最先进的性能，同时，通过人类评估和定性结果证明了模型对话的幻觉和吸引力，验证了检索的有效性。

Jan, 2023

FaithDial: 一个忠实的对话信息寻求基准

本研究提出了一种数据中心的解决方案，利用 FaithDial 数据集为基础，设计了识别和消除幻觉对话的模型，并证明 FaithDial 数据集可以作为高质量对话生成模型的训练信号，并且可推广到其他数据集上。

Apr, 2022

检索增强减少对话中的幻觉

本文研究了基于神经检索的循环架构在知识驱动的对话中的应用，将多个组件（检索器、排名器和编码器 - 解码器）结合在一起以最大化可知性并保留对话能力，在两个知识驱动的对话任务中实现了最先进的性能，并经过人工评估证实，大大减少了在最先进的聊天机器人中存在的知识幻觉问题。

Apr, 2021

对话生成的深度强化学习

本研究基于强化学习，建立一个可生成更多交互式回复、更长且不重复的对话、更容易回答问题的聊天机器人的神经对话模型。

Jun, 2016

可信的增强检索对话机器人

对话人工智能存在生成不正确信息或产生幻觉的问题，本研究提出了一种结合了符合预测和全局测试的统计保证的检索增强问答系统，并使用贝叶斯优化来选择全局测试的超参数，通过在自然问题数据集上验证结果表明该方法能够提供所需的覆盖保证并最小化平均预测集大小。

Jul, 2023