弹性权重去除用于忠实且抽象的对话生成

Mar, 2023

弹性权重去除用于忠实且抽象的对话生成

Elastic Weight Removal for Faithful and Abstractive Dialogue Generation

Nico Daheim, Nouha Dziri, Mrinmaya Sachan, Iryna Gurevych, Edoardo M. Ponti

TL;DR提出了一种称为弹性权重剔除（EWR）的方法，该方法通过测量权重的不确定性来约束预先训练的模型参数，使得对话系统生成关于相关文件的信息时，不会产生错误或不可验证的信息。该方法使用 Flan-T5 作为主干语言模型，通过自动和人工评估表明，它在提高忠诚度方面具有系统性的优势。同时该方法还可以同时限制幻觉和提取响应，以防止浅层的复制和粘贴文档范围的情况。

Abstract

Ideally, dialogue systems should generate responses that are faithful to the knowledge contained in relevant documents. However, many models generate hallucinated responses instead that contradict it or contain u

dialogue systems hallucinated responses faithfulness flan-t5 elastic weight removal

发现论文，激发创造

语音助手系统中的查询扩展和实体加权查询重构检索

本文提出了一种新的查询扩展和实体加权方法，利用实体目录中的实体关系改进查询重构性能，实验发现该方法相比不使用查询扩展和加权的基准模型，特别是在前 10 个结果中，精度有 6% 的提高，在使用查询扩展和加权的其他基准模型中，精度有 5% 以上的提高。

Feb, 2022

弹性权重巩固以获得更好的偏差接种

使用 EWC 精细调优可以减轻训练数据集中的偏见，同时对于原始训练数据集的遗忘率较低。

Apr, 2020

通过专业权重评估和减少 LLM 虚构，无需黄金标准答案

通过权重 LLMs 的事实性评估（FEWL），我们提出了第一个专门针对没有黄金标准答案的情况的幻觉度量标准，该度量标准借助现成的 LLMs 回答充当黄金标准答案的代理，以更准确地测量幻觉，从而减少存在的威胁并提高 LLMs 的可靠性和信誉。

Feb, 2024

通过少量专家示范融合奖励函数，实现忠实准确的知识导向对话生成

开发值得信赖的对话式信息搜索系统依赖于能够基于相关知识文本生成忠实准确响应的对话模型。我们通过引入一种新的奖励函数利用强化学习算法来克服数据偏见和冗余信息的两个主要挑战，并在两个对话式信息搜索数据集上的实证实验中展示了我们的方法可以与其他强大的监督学习基准相竞争。

Nov, 2023

神经对话模型的实例加权：不是所有对话都是平等的

本文研究了利用加权模型解决神经会话模型训练过程中困难的问题，并在电影和电视字幕训练数据上证明该方法能提高模型性能。

Apr, 2017

检索增强减少对话中的幻觉

本文研究了基于神经检索的循环架构在知识驱动的对话中的应用，将多个组件（检索器、排名器和编码器 - 解码器）结合在一起以最大化可知性并保留对话能力，在两个知识驱动的对话任务中实现了最先进的性能，并经过人工评估证实，大大减少了在最先进的聊天机器人中存在的知识幻觉问题。

Apr, 2021

自然语言生成数据集中数据错误的追踪和清除

该研究提出了一种框架，利用基于对比度的算法识别和清除训练数据中的一些低质量样本，从而实现减少自然语言生成任务中的幻觉和不忠实输出的目的。

Dec, 2022

基于实体挖掘的后期话语优化方法用于忠实的知识驱动对话

提出了一种名为 REM 的后期修饰方法，以增强生成的幻觉话语的质量和忠诚度，通过根据源知识对其进行修饰，减少了话语中的实体幻觉。

Jun, 2024

FaithDial: 一个忠实的对话信息寻求基准

本研究提出了一种数据中心的解决方案，利用 FaithDial 数据集为基础，设计了识别和消除幻觉对话的模型，并证明 FaithDial 数据集可以作为高质量对话生成模型的训练信号，并且可推广到其他数据集上。

Apr, 2022

使用弹性权重一致性进行神经机器翻译的无监督预训练

本文研究了神经机器翻译中的无监督预训练方法，使用 Elastic Weight Consolidation 对双向编码器和解码器进行初始化，通过 fine-tune 来避免原始语言建模任务的遗忘，并将其与以前的正则化工作进行比较，结果表明使用这种方法可以快速收敛而且不需要原始未标记的数据。

Oct, 2020