关键词speaker identity
搜索结果 - 16
  • WavRx:一种疾病不可知、通用和隐私保护的语音健康诊断模型
    PDF8 days ago
  • 自监督模型与人类中的演讲者身份编码评估
    PDF20 days ago
  • 通过合成注释实现高保真度文本转语音的自然语言指导
    PDF5 months ago
  • 通过感知的声音特质实现说话人身份的可解释表示
    PDF9 months ago
  • 面向风格的语音:面至声自然零样本语音合成中面部图像的改进潜在映射
    PDF9 months ago
  • PromptTTS++:使用自然语言描述控制基于提示的文本到语音中的说话人身份
    PDF10 months ago
  • 通过操作语音风格潜在因素进行跨说话人情感转移
    PDFa year ago
  • FaceXHuBERT:基于自监督语音表征学习的无文字驱动表情丰富的 3D 面部动画合成
    PDFa year ago
  • 无监督语音重构中解离韵律表示
    PDF2 years ago
  • 利用声学上下文调节、话语嵌入和参考编码器实现零样本基于文本的语音编辑
    PDF2 years ago
  • 在师生框架下进行数据增强的跨语言合成
    PDF2 years ago
  • 数据增强用于文本转语音的跨说话人风格转移
    PDF2 years ago
  • 从文本、音频、说话者身份的三模态上下文生成言语手势
    PDF4 years ago
  • 使用跨模态自监督进行解缠语音嵌入
    PDF4 years ago
  • 语音识别中的隐私保护对抗性表征学习:现实还是幻象?
    PDF5 years ago
  • StarGAN-VC:基于星形生成敌对网络的非平行多对多语音转换
    PDF6 years ago
Prev
Next