BriefGPT.xyz
大模型
Ask
alpha
关键词
speaker representation
搜索结果 - 3
神经发音者嵌入中的余弦评分与不确定性
该论文提出了一种在说话者嵌入前端估计和余弦相似度评分后端传播不确定性的方法,实验证实了该方法在处理由嵌入估计引起的不确定性方面的有效性,与传统的余弦相似度相比,EER 和 minDCF 平均减少了 8.5% 和 9.8%,在实践中计算效率也
→
PDF
4 months ago
自我监督的语音和说话者模型学到了什么?来自跨模型逐层分析的新发现
该研究探索了自监督学习模型在捕捉语音和说话者表示方面的能力,并发现具体层次的语音模型更专注于捕捉语言信息,而说话者模型则更注重对说话者表示的提炼。
PDF
5 months ago
使用自适应和多头自注意力进行语音增强
该论文研究了一种使用辅助说话者感知特征的自适应语音增强方法,从测试话语中直接提取用于适应的说话者表示。采用多任务学习的语音增强和说话人识别,并使用说话人识别分支的最终隐藏层输出作为辅助特征。此外,采用多头自注意力机制捕捉语音和噪声的长期依赖
→
PDF
4 years ago
Prev
Next