关键词diarization performance
搜索结果 - 2
- 提高端到端神经分离模型模拟对话自然度
研究了一种用于模拟自然对话的方法,用于训练端到端神经音频分离技术(EEND),并提出了一种考虑交替对话方式的模拟方法,用于在缺乏真实语音数据的情况下,优化 EEND 模型的训练。通过对 CALLHOME 和 CSJ 数据集的实验结果表明,使 - 动态尺度加权多尺度说话人分离
本研究提出基于多尺度解码器的高级多尺度语者分离系统,通过多尺度聚类初始化估计讲话人数和每个尺度的平均发言者表示向量,使用 1-D 卷积神经网络动态决定每个时间步长上每个尺度的重要性,抑制了时间分辨率和发言者表示保真度之间的平衡问题。该系统可