Sep, 2023

支持会议识别的连续语音分离的混合编码器

TL;DR此研究通过引入混合编码器,将重叠的语音分离为无重叠的流,从而处理多说话人和动态重叠的自然会议环境中的自动语音识别,实验结果表明混合编码器具有最先进的性能并强调了 TF-GridNet 的强大分离能力。