Jun, 2022

变率分层 CPC 用于语音中的声学单位发现

TL;DR本文通过自监督学习探索了多层对比预测编码 (CPC) 模型对语音的分层表示,提出了一种基于不均匀下采样的模型,通过聚焦负采样和量化目标等方法增强了其对深度、离散性的优化,从而在 speech recognition 任务上得到了更好的效果,同时也实现了语音信号的有效分割。