BriefGPT.xyz
大模型
Ask
alpha
关键词
statistics pooling
搜索结果 - 3
AmberNet: 一种紧凑的端到端口语识别模型
AmberNet 是一种用于口语识别的紧凑端到端神经网络,由一维深度可分离卷积和全局上下文的 Squeeze-and-Excitation 层、统计汇聚和线性层组成,大小是现有技术 (SOTA) 模型的 1/10,准确率达到 FLEURS
→
PDF
2 years ago
基于 TDNN 的说话人验证中的强调通道关注和传递聚合 (ECAPA-TDNN)
本文提出了一种基于统计汇聚、1D Res2Net 模块和 Squeeze-and-Excitation 机制等增强方法的 ECAPA-TDNN 神经网络架构,利用此架构改进了当前流行的 X-Vector 神经网络架构,显著提高了说话人识别性
→
PDF
4 years ago
深度说话人嵌入的注意统计池化
本文提出了一种基于关注机制统计池化的深度说话人嵌入,在 NIST SRE 2012 和 VoxCeleb 数据集上的评估结果显示,它在说话人验证任务中比传统方法减少了 7.5% 和 8.1% 的等错误率,其适配长期说话特征变化的能力更强。
PDF
6 years ago
Prev
Next