BriefGPT.xyz
大模型
Ask
alpha
关键词
phoneme representations
搜索结果 - 2
XPhoneBERT:用于文本到语音的音素表征的预训练多语种模型
本研究介绍了 XPhoneBERT,这是第一个多语种模型,经过预训练学习用于下游文本转语音任务的音素表示。我们使用 RoBERTa 预训练方法对近 100 种语言和地区的 330M 个音素级句子进行了训练。实验结果表明,将 XPhoneBE
→
PDF
a year ago
ACL
基于发音学特征的低资源文本转语音语言无关元学习
通过使用来自发音矢量而非语音学单元的嵌入来学习跨语言的音素表示,结合语言无关的元学习,使得我们只需要 30 分钟的语音数据即可在以前从未见过的语言中,通过微调高质量的文本转语音模型,并由以前未见过的发言者发音。
PDF
2 years ago
Prev
Next