Apr, 2022

ContentVec: 通过分解说话人的语音表示来改进自监督语音表示

TL;DR本文介绍了一种新的自监督学习方法,采用 HuBERT 框架并结合分离机制,能够在不丢失语音信息的前提下实现说话人分离,并在内容相关的下游任务中获得显著的性能提升。