Jun, 2023
BabySLM:面向语言习得友好的自监督口语模型基准
BabySLM: language-acquisition-friendly benchmark of self-supervised spoken language models
Marvin Lavechin, Yaya Sy, Hadrien Titeux, María Andrea Cruz Blandón, Okko Räsänen...
TL;DR本文介绍了一种适用于语言习得的基准测试方法,该方法可以在词汇和句法水平上测试口语识别模型的能力,旨在进一步深入理解婴儿学习语言的过程以及使自监督学习技术能够充分发挥潜力,同时还需要克服文本和语音之间以及清晰语音和野外语音之间的差距。