Jun, 2023

利用持续预训练和学习池化的声学词嵌入技术提取未标注目标语言

TL;DR本研究探讨了改进 acoustic word embeddings 的两种方法:使用预训练的 self-supervised model 进行 continued pre-training,以及使用 multilingual phone recognizer (MPR) 进行训练 pooling function。研究表明使用这两种方法在四种语言上在单词识别方面优于最近的方法,而且 MPR 方法比 KNN 搜索快得多,数据利用效率高。