BriefGPT.xyz
Ask
alpha
关键词
soft target distillation
搜索结果 - 1
软硬目标 RNN-T 蒸馏在大规模 ASR 中的比较
本文研究了将知识从一个训练规模较大的教师模型转移到较小的学生模型中的知识蒸馏技术,在 LibriSpeech / LibriLight 公共数据集(60k 小时)和我们公司的内部数据(600k 小时)上对大规模 RNN-T 模型的软目标和硬
→
PDF
2 years ago
Prev
Next