Oct, 2021

使用分段对比预测编码进行无监督语音分割和可变速率表示学习

TL;DR该论文提出了一种使用自监督学习和分段对比预测编码框架来同时完成语音信号的音素和类似单词的分割任务,并发现了连续元音或半元音之间的边界是最难识别的,从而可以在较低的特征提取率下提取出更好的语音特征。