BriefGPT.xyz
大模型
Ask
alpha
关键词
embedding distillation
搜索结果 - 2
使用预训练语言模型、嵌入蒸馏和上采样策略改善 CTC 非自回归翻译质量
通过使用 CTC loss 进行微调 PMLM 模型、采用 MASK 插入方案进行上采样、使用嵌入蒸馏方法进一步提高性能,使得非自回归模型获得了更好的翻译质量和加速,并在多个数据集上优于自回归模型
PDF
a year ago
eTag: 基于嵌入蒸馏和任务导向生成的类增量学习
本研究提出了一种称为 eTag 的方法,通过嵌入蒸馏和面向任务的生成,无需存储样本或原型即可增量训练神经网络,以解决 Class-Incremental Learning 中的遗忘问题,并在 CIFAR-100 和 ImageNet-sub
→
PDF
a year ago
Prev
Next