对话生成中的特定性控制数据精炼

Feb, 2017

对话生成中的特定性控制数据精炼

Data Distillation for Controlling Specificity in Dialogue Generation

Jiwei Li, Will Monroe, Dan Jurafsky

TL;DR本研究提出了一种基于神经网络的对话代理方法，通过数据精简和模型训练相结合的方式，使得该代理能够根据输入上下文自动调整回复的具体程度，同时使用增强学习系统从多个生成模型中选择最适合当前输入的模型，从而生成更有趣、更高质量的回复。

Abstract

People speak at different levels of specificity in different situations. Depending on their knowledge, interlocutors, mood, etc.} A conversational agent should have this ability and know when to be specific and when to be general. We propose an approach that gives a →

conversational agent neural network dialogue generation data distillation reinforcement learning

发现论文，激发创造

通过负抽取实现神经对话生成的多样化

本文提出一种新的负面训练方法，即 “负面蒸馏”，使用多级负面知识来避免生成对话模型中的泛化回复问题。实验结果表明，与以前的负面训练方法相比，我们的方法性能显着提高。

May, 2022

小数据场景中高效自然语言理解的生成 - 蒸馏方法

通过 generation-distillation 训练方法，利用大型 fine-tuned 语言模型生成无标签训练数据，通过知识蒸馏技术将这些数据的知识转移给小型网络，从而缩小了预先训练 LM 和小型特定任务模型之间的性能差距，实现了使用更少的参数（仅为 BERT 的 300 倍）达到与 BERT 可比的性能。

Jan, 2020

文本分类的数据精炼

本研究提出了一种新的数据蒸馏方法，使用该方法在文本分类中将大型训练数据集压缩为更小的合成数据集，结果显示使用压缩后的数据集，在保持准确度的前提下只占原始数据集的 0.1%，获得了 90% 左右的性能。

Apr, 2021

改进数据集精炼的跨架构泛化

使用模型池方法进行数据蒸馏，结合知识蒸馏技术进行测试，从而创造出小规模合成数据集，在性能上表现优于现有方法。

Feb, 2024

基于分支协作的异构学习对话生成

使用对话属性的双重群协作知识蒸馏，降低分支之间的同质性问题，并在两个公共领域的对话数据集中实现了超越先前工作的表现。

Mar, 2023

数据集压缩

本文中，我们探讨了数据集蒸馏的另一种形式，即基于固定模型的数据集蒸馏，通过使用少量的数据点近似原始数据的训练模型，此方法相对于其他方法具有优势，并在多个数据集上进行了实验证明

Nov, 2018

双向蒸馏的多视角特征表示在对话生成中的应用

本文提出一种基于知识蒸馏的对话模型训练框架，通过分组多任务学习、多视角特征蒸馏和双向蒸馏等策略，找到多数据集共性知识以提高模型泛化性能。实验结果表明该框架可以有效地提高模型的泛化性能，而不影响训练效率。

Feb, 2021

通过知识选择改进预训练语言模型的知识蒸馏

本文提出了一种基于演员 - 评论家方法的知识蒸馏框架，旨在从教师模型中选择适当的知识来训练学生模型，实验结果表明该方法在 GLUE 数据集上优于常规基线模型。

Feb, 2023

基于角色的对话生成模型无关数据操作方法

为了构建智能对话代理，针对当前有限的基于人物特征的对话数据不足以很好地训练对话生成模型的问题，提出了一种数据处理方法，该方法适用于任何基于人物特征的对话生成模型以提高其性能，并通过实验表明了其优越性。

Apr, 2022

隐私蒸馏：降低多模态扩散模型的再识别风险

引入隐私蒸馏框架让文本到图像生成模型传授另一个模型而不暴露可识别数据，可以有效地减少再识别风险，同时维持下游性能。

Jun, 2023