Oct, 2022

通过模拟真实的语音重叠,提高多说话人语音识别

TL;DR本文提出了一种改进的模拟多说者重叠讲话的技术,该技术使用离散标记的序列来表示任意模式的语音重叠,从而使模型能够从实际对话中学习语音重叠模式,并在多个数据集上提高了单词错误率。