BriefGPT.xyz
Ask
alpha
关键词
untranscribed data
搜索结果 - 2
ESSumm: 从未转录会议中提取式演讲摘要
本文提出了一种新颖的直接抽取式语音摘要架构 ESSumm,它是一种基于深度学习的无线束模型,可以直接从语音中生成摘要,极大地提高了从未转录的数据的摘要质量。
PDF
2 years ago
Guided-TTS 2: 一种高质量自适应文本转语音扩散模型,可使用未转录数据
Guided-TTS 2 是一种基于扩散的生成模型,通过无文本数据实现高质量自适应语音合成。它结合了以发言者为条件的扩散模型和以发言者为依赖的音素分类器,借此适应文本到语音。通过无分类器指导的方法在大规模的未转录数据集上训练模型,然后在目标
→
PDF
2 years ago
Prev
Next