Jan, 2024

重叠感知的端到端监督层次图聚类用于发言人分离

TL;DR通过图神经网络的端到端监督分层聚类算法(E-SHARC)可以改善目前状态下的说话人辨别系统,特别是在重叠语音区域的预测上。