从领域外数据进行蚕合以删选知识

Oct, 2021

从领域外数据进行蚕合以删选知识

Mosaicking to Distill: Knowledge Distillation from Out-of-Domain Data

Gongfan Fang, Yifan Bao, Jie Song, Xinchao Wang, Donglin Xie...

TL;DR该研究提出了一种基于 MosaicKD 的知识蒸馏方法，可以使用低成本的跨域数据来训练模型，显著优于现有的方法，并在分类和语义分割等任务中得到了验证。

Abstract

knowledge distillation~(KD) aims to craft a compact student model that imitates the behavior of a pre-trained teacher in a target domain. Prior KD approaches, despite their gratifying results, have largely relied on the premise that \emph{in-domain} data is available to carry out the k

knowledge distillation out-of-domain data mosaickd adversarial training semantic segmentation

发现论文，激发创造

不同领域之间的直接蒸馏

基于知识蒸馏，提出了一种新的单阶段方法 “不同领域之间的直接蒸馏”(4Ds)，通过可学习的适配器和融合 - 激活机制，实现了从教师网络到学生网络的跨领域知识转移，取得了可靠的学生网络性能并超过了现有方法。

Jan, 2024

Meta-KD: 跨领域语言模型压缩的元知识蒸馏框架

利用领域间的可转移知识，我们提出了一种元知识蒸馏 (Meta-KD) 框架，将初始的深度预训练模型压缩为体积更小的单域学生模型，并在多个 NLP 任务上进行了实验验证。

Dec, 2020

采样与蒸馏：开放世界数据的知识迁移

提出了一种名为数据无关知识蒸馏（DFKD）的新任务，旨在使用仅带有原始训练数据的教师网络训练高性能学生模型。通过自适应采样模块对接近原始数据分布的开放世界数据进行采样，引入低噪声表示以减轻领域漂移并建立多个数据示例的结构化关系来开发数据知识。在 CIFAR-10、CIFAR-100、NYUv2 和 ImageNet 等广泛实验中，我们的 ODSD 方法实现了最先进的性能，在 ImageNet 数据集上与现有结果相比，准确率提高了 1.50％-9.59％。

Jul, 2023

黑盒少样本知识蒸馏

本文提出了一种黑盒少样本知识蒸馏方法，使用 MixUp 和条件变分自编码器生成多样的合成图像进行训练，显著优于最新 SOTA 的少 / 零样本 KD 方法用于图像分类任务。

Jul, 2022

尊重知识蒸馏中的转移差距

该研究论文提出了一种新的逆概率加权蒸馏 (IPWD) 方法，用于解决知识蒸馏时两个领域之间数据分布不同的问题，该方法通过对样本的倾向得分估计进行加权，以弥补非独立同分布的数据中低频样本的不足，有效提高了知识蒸馏的准确度。

Oct, 2022

KD3A: 通过知识蒸馏进行无监督多源去中心化域自适应

KD3A 是一种隐私保护的多源领域自适应算法，它通过对来自不同源域的模型进行知识蒸馏来实现域适应，并采用多源知识投票、共识聚焦和 BatchNorm MMD 等方法解决了常规 UMDA 方法中存在的负迁移、安全通信和数据质量等问题，同时相对于其他分散式 UMDA 方法可降低 100 倍的通信成本，且表现也显著优于现有 UMDA 方法。

Nov, 2020

AuG-KD：面向领域外知识蒸馏的锚点混合生成

利用不受数据限制的知识蒸馏方法（DFKD），通过不确定性导向和样本特定锚定来解决智能系统在隐私问题、性能退化和合适知识转移方面的挑战。

Mar, 2024

MixKD：大规模语言模型高效蒸馏

提出了一种利用 Mixup 数据扩充技术的数据不可知蒸馏框架 MixKD，大幅度降低了一些实践性问题的影响，提升了大规模语言模型的泛化能力，实现了比标准 KD 培训更好的性能表现，能用于低资源平台上的应用。

Nov, 2020

利用神经网络中的反向传播知识改进知识蒸馏

该论文提出了一种新的知识蒸馏方法，通过在教师模型与学生模型差异较大的地方提取知识，在生成新的辅助样本的过程中改善学生模型的性能，从而使教师模型与学生模型更加匹配。这种方法在自然语言处理和计算机视觉等领域得到了良好的实验结果。

Jan, 2023

通过内部数据知识蒸馏在去中心化学习中统一非独立同分布数据

本文提出一种叫作 IDKD 的分布式学习方法，通过使用公共数据集而不会破坏隐私约束以实现数据分布的同质化，该方法在多个图形拓扑结构上实验证明可以达到比传统知识蒸馏更好的效果。

Apr, 2023