Aug, 2022

实时说话人分离的时间自训练

TL;DR该研究使用时间排序的自我训练方法,证明只使用 1 秒的样本训练可以将语音流分为不同的讲话者,并在多种语言中将错误率降低至 10% 以下。