Sep, 2019

FaSNet:适应性低延迟波束成形技术在多麦克风音频处理中的应用

TL;DR提出了一种适用于低延迟场景的时域、基于过滤的波束成形方法 ——FaSNet,该方法可在含噪声和混响语音增强中表现出色,同时还可在 CHiME-3 数据集上通过训练基于频域目标函数的 FaSNet 模型实现与基准模型相比的相对字错误率降低 14.3%。