Jun, 2022
变率分层 CPC 用于语音中的声学单位发现
Variable-rate hierarchical CPC leads to acoustic unit discovery in speech
Santiago Cuervo, Adrian Łańcucki, Ricard Marxer, Paweł Rychlikowski, Jan Chorowski
TL;DR本文通过自监督学习探索了多层对比预测编码 (CPC) 模型对语音的分层表示,提出了一种基于不均匀下采样的模型,通过聚焦负采样和量化目标等方法增强了其对深度、离散性的优化,从而在 speech recognition 任务上得到了更好的效果,同时也实现了语音信号的有效分割。