Jun, 2023

非监督单元发现在 SSL 语音表示方面的极限探索

TL;DR本文提出了两个模型,MonoBERT 和 PolyBERT,它们使用上下文无关和上下文相关的音素为预训练提供了目标改进。我们的模型在 LibriSpeech 基准测试中显著优于其他自监督学习模型,无需迭代重新分簇和重新训练。此外,我们的模型配备上下文相关单元,甚至优于在预训练期间使用标记数据的目标改进模型。通过实验证明了如何逐步改进单元发现过程。