BriefGPT.xyz
Ask
alpha
关键词
acoustic tokens
搜索结果 - 2
MaskSR:面向全频段语音恢复的 Masked Language Model
语音恢复是在各种失真的情况下恢复高品质语音的目标。本文提出了一种名为 MaskSR 的掩码语言模型,能够联合考虑噪声、混响、剪切和低带宽来恢复全频 44.1 kHz 的语音。MaskSR 利用预训练的神经编解码器提取离散声学令牌。在训练过程
→
PDF
a month ago
通过对音频嵌入进行对抗学习映射关系实现完全无监督的音素识别
本文提出一种利用生成对抗网络进行无监督音素识别的方法,并取得了 36% 的准确率。
PDF
6 years ago
Prev
Next