Mar, 2022
多模态相关性学习:用于主动说话人检测和语音增强的方法
Look\&Listen: Multi-Modal Correlation Learning for Active Speaker Detection and Speech Enhancement
Junwen Xiong, Yu Zhou, Peng Zhang, Lei Xie, Wei Huang...
TL;DR提出了一个统一框架,通过视听联合建模来实现目标说话人检测和语音增强,以建立音频 - 视觉任务中的多模态关联。