BriefGPT.xyz
Ask
alpha
关键词
multiple speakers
搜索结果 - 5
ICLR
利用众包数据构建一种卢干达语文字转语音模型
通过使用多位相似语调的多说话者的数据进行训练,并应用数据预处理方法来改善语音质量,表明在较少数据的情况下,通过获取多位相似语调的多说话者的数据来提高 TTS 质量的有效性。
PDF
2 months ago
MM
野外任意说话人唇语合成
采用新型的 VAE-GAN 架构生成多说话者在野外拍摄的沉默唇视频中的语音,比其他基线模型表现更好,能够实现针对特定身份的微调和生成不同语音的语音序列。
PDF
2 years ago
EMNLP
对话摘要的一袋技巧
本研究针对对话摘要技术所面临的特殊需求,探索处理多个发言者对话识别、否定理解、情景推理和非正式语言理解四大挑战,并使用预先训练的序列到序列语言模型进行实验,通过发言者名称代替、否定范围突出、多任务学习与域内预训练等方法提高摘要表现,超越强基
→
PDF
3 years ago
优化置换训练的多说话人单通道语音分离
本研究提出一种使用匈牙利算法进行排列不变训练的神经语音分离方法,可以高效地处理多达 20 个说话者的语音数据。
PDF
3 years ago
ICML
未知数量多方讲话者的声音分离
我们提出了一种使用门控神经网络在多个处理步骤中训练以将不同数量的混合说话人分离的新方法,该方法在保持每个输出通道中的说话人不变的同时。我们为每个可能的说话人数量训练了不同的模型,并使用具有最多说话人数的模型来选择给定样本中的实际说话人数。该
→
PDF
4 years ago
Prev
Next