ACLMay, 2022
用有限资源通过声学手段量化语言变异
Quantifying Language Variation Acoustically with Few Resources
Martijn Bartelds, Martijn Wieling
TL;DR本研究通过 wav2vec 2.0 模型中提取的嵌入来区分多达 100 种荷兰四种方言的发音差异,结果表明,基于声学模型的方法优于基于电话转录的方法,且 XLSR-53 模型在荷兰方言的微调后表现最佳,仅仅利用六秒的语音,即可得到与实际情况吻合的聚类。