Sep, 2020

VoiceFilter-Lite: 面向设备的实时定向语音分离技术用于语音识别

TL;DR本论文介绍了一种能够实时运行于设备上的单通道源分离模型,其可以从一个目标说话者的语音信号中仅保留语音信息,以优化流式语音识别系统的表现。该模型具有分离源、单通道、语音识别、自适应运行时和实时这些特别之处,并通过使用一种新的不对称损失和采用自适应运行时抑制强度来实现这些目标。本论文最终证明了,这种模型可以被量化为 8 位整型模型,并且可以实时运行于设备上。