BriefGPT.xyz
大模型
Ask
alpha
关键词
speech pre-training
搜索结果 - 3
ICLR
SPIRAL: 自监督扰动不变表示学习语音预训练
本研究提出了一种名为 SPIRAL 的语音预训练方法,它采用带噪数据的教师 - 学生框架学习去噪表示,通过对输入施加随机扰动来提高噪声鲁棒性,达到了与当前最优方法 wav2vec 2.0 相当或更好的性能并大幅降低了训练成本。
PDF
2 years ago
ACL
基于韵律的无文本生成式语音语言建模
本文提出了一种基于多流 Transformer 和 HiFi-GAN 的韵律感知生成口语语言模型 (pGSLM),利用韵律为生成式预训练提供了更好的理解和生成能力。实验结果表明,该模型可以显著提高韵律和内容建模,并能够生成自然、有意义和连贯
→
PDF
3 years ago
TERA:基于自监督学习的 Transformer 编码器音频表示学习
介绍了一种称为 TERA 的自监督语音预训练方法,利用一种通过沿着三个正交轴对变换来预训练 Transformer Encoders 的方法,在多个下游任务中实现了出色的性能。
PDF
4 years ago
Prev
Next