Apr, 2021

端到端的说话人分割,针对重叠感知的重分割

TL;DR提出了一种基于端到端模型的说话人分割方法,直接进行说话人划分,通过多标签分类解决此任务,同时可用于语音活动检测和重叠语音检测,且在多个数据集上都有显著的表现提升。