May, 2023

DinoSR:基于自蒸馏和在线聚类的自监督语音表示学习

TL;DR本研究介绍 DinoSR,一种使用自我蒸馏和在线聚类的自监督语音表示学习方法,其中结合了掩码语言建模,自我蒸馏和在线聚类,实验表明这些概念互补,并形成了语音强表示学习模型。