Jul, 2020

自监督对比学习用于无监督音素切分

TL;DR本研究提出了一种自监督表示学习模型,用于无监督音素边界检测,该模型是一个卷积神经网络,直接在原始波形上进行操作,利用噪声对比估计原则优化识别信号中的频谱变化,并在测试时间通过峰值检测算法应用于模型输出以产生最终边界。结果表明,该方法优于基线模型,并在两个数据集上达到了最先进的性能,同时使用额外未转录数据有助于模型表现。