BriefGPT.xyz
Ask
alpha
关键词
distillation training
搜索结果 - 3
基于深度平衡模型的一步扩散蒸馏
本论文介绍了一种简单但有效的方法,即将扩散模型直接从初始噪声提炼到生成的图像,使用深度平衡模型作为提炼架构。该方法通过仅使用扩散模型中的噪声 / 图像对进行离线训练,在与现有一步方法相当的训练预算上实现了卓越的性能。
PDF
7 months ago
TVT: 在小数据集上无需训练的视觉 Transformer 搜索
本文提出了一种无需训练的视觉 Transformer(ViT)架构搜索方法,通过使用教师模型,利用具有零成本代理的方式搜索更好的 ViT,并在各种小型数据集和搜索空间上展开了大量实验,证明了该方法优于现有的无训练搜索方法。
PDF
7 months ago
ICCV
重新思考数据精炼:不要忽视校准
神经网络在蒸馏数据上训练往往会产生过于自信的输出,需要通过温度标定和混合等校准方法进行修正。然而,现有的校准方法对于在大型源数据蒸馏产生的网络并不适用。本文显示,由于最大逻辑概率的分布更集中以及语义有意义但与分类任务无关的信息的丢失,蒸馏数
→
PDF
a year ago
Prev
Next