Jun, 2021

无监督单词分段的分段对比预测编码

TL;DR本文提出了一个用于零资源语音处理的新的模型,称为分段对比预测编码,能够对音频信号的帧级和更高级别的分组进行编码,并将此模型用于音素和单词分割,结果在 TIMIT 和 Buckeye 数据集上显著优于现有方法。