Oct, 2023

用于神经说话人分割的多类别交叉熵损失函数

TL;DR本文通过对 9 个不同测评的广泛实验,展示了从多标签分类转换到功集多类分类的形式可以显著提高性能(特别是对于重叠语音)和对领域不匹配的鲁棒性,同时消除多标签分类的检测阈值超参数。