Sep, 2023

DiaCorrect: 说话人分离的纠错后端

TL;DR我们提出了一种名为 DiaCorrect 的错误修正框架,以简单而有效的方式改进音讯识别系统的输出。该方法受自动语音识别中的错误修正技术的启发。我们的模型包括两个并行的卷积编码器和一个基于转换的解码器。通过利用输入录音和初始系统输出之间的相互作用,DiaCorrect 可以自动校正初始说话者活动以最小化识别错误。在 2 个人的电话数据上的实验表明,所提出的 DiaCorrect 可以有效地改善初始模型的结果。我们的源代码公开可用于此 https URL。