BriefGPT.xyz
大模型
Ask
alpha
关键词
utterance-level
搜索结果 - 2
通过预测基于标记的声学潜变量学习话语级表示以用于情感语音合成
本论文提出了一种表达性语音合成模型,该模型利用标记级别的潜在韵律变量来捕捉和控制话语级别属性,如角色配音和说话风格,其中的潜在细节级别空间同时也捕捉更粗粒度的信息。
PDF
2 years ago
SAMU-XLSR:语义对齐的多模态话语级跨语言语音表示
提出了 SAMU-XLSR 模型,基于语义对齐的多模态跨语言话语级别语音表示学习框架。通过将 XLS-R 模型和 LaBSE 模型组合,SAMU-XLSR 模型可以提取高质量的多模态多语言话语语音特征,并可以实现跨语音和跨文字之间的相互转换
→
PDF
2 years ago
Prev
Next