BriefGPT.xyz
大模型
Ask
alpha
关键词
distilled models
搜索结果 - 2
DistilXLSR: 轻量级跨语言语音表示模型
本文介绍了一种基于 DistilXLSR 的语音表征模型,通过随机打乱现有语音的音素,降低语言信息,在只使用英语数据的情况下,压缩跨语言模型并设计一种层级初始化方法,成功减少 50% 参数并在 15 种低资源语言和 2 种教师模型的实验中保
→
PDF
a year ago
不让任何参数落下:蒸馏和模型大小对零 - shot 检索的影响
本研究表明,在信息检索任务中,经过裁剪的小型语言模型是大型、速度慢得多的模型的强有力竞争者。在信息检索实际应用中,由于延迟限制,压缩和稠密模型成为首选。然而,通过实验,我们发现模型大小和早期查询文档交互对检索模型的泛化能力起着重要作用。增加
→
PDF
2 years ago
Prev
Next