BriefGPT.xyz
Ask
alpha
关键词
voxceleb2 dataset
搜索结果 - 2
用于语音情感识别的矢量量化掩码自编码器
本文介绍了使用自监督学习方法的矢量量化掩模自动编码器模型 VQ-MAE-S,该模型基于离散空间的 向量量化变分自动编码器 中的掩模自动编码器(MAE)对语音信号中的情感进行识别。在 VoxCeleb2 数据集的 预训练 和情感性语音数据的
→
PDF
a year ago
基于注意力神经网络融合的噪声容忍音视频人员在线验证
用多模态方法,包括语音和图像信号,提出了一个基于神经网络的在线人员验证系统。该网络通过学习多感官关联来达到验证任务的目的,并利用了关注机制来选择具有显著性的模态,以提供补充的输入。在 VoxCeleb2 数据集上,该方法表现出比其他多模态和
→
PDF
6 years ago
Prev
Next