Mar, 2022

多模态相关性学习:用于主动说话人检测和语音增强的方法

TL;DR提出了一个统一框架,通过视听联合建模来实现目标说话人检测和语音增强,以建立音频 - 视觉任务中的多模态关联。