Mar, 2022

使用统一的时频 Siamese-Unet 提取单个麦克风扬声器

TL;DR本文提出了一种统一的时频方法,在清洁和嘈杂的条件下进行说话者提取。该方法采用了 Siamese-Unet 结构,使用频率域和时间域表示,以及采用了规范化的频域损失,最终在实验结果上达到了比传统的说话者提取方法和盲源分离方法更好的效果。