Nov, 2018

基于注意力神经网络融合的噪声容忍音视频人员在线验证

TL;DR用多模态方法,包括语音和图像信号,提出了一个基于神经网络的在线人员验证系统。该网络通过学习多感官关联来达到验证任务的目的,并利用了关注机制来选择具有显著性的模态,以提供补充的输入。在 VoxCeleb2 数据集上,该方法表现出比其他多模态和单模态方法更好的鲁棒性和可靠性。