Feb, 2024

LightCAM: D-Tdnn 语者验证的快速轻量级上下文感知遮蔽算法实现

TL;DR本研究提出了一种快速、轻量级的模型 LightCAM,它采用了深度可分离卷积模块 (DSM) 和多尺度特征聚合 (MFA) 技术,在 VoxCeleb 数据集上进行了广泛实验,结果显示在 VoxCeleb1-O 中,它实现了 0.83 的等错误率 (EER) 和 0.0891 的最小检测费用 (MinDCF),优于其他主流的说话者验证方法,并且复杂性分析表明所提出的架构具有较低的计算成本和更快的推理速度。