Dec, 2023

基于神经变换器的巴西葡萄牙语语音声学模型

TL;DR通过 Transformer 神经网络构建了一个训练于大量巴西葡萄牙语言音资料上的声学模型,使用预训练技术细调该模型并在呼吸不足检测、性别识别和年龄组分类三个任务中表现出显著提升,尤其在呼吸不足检测方面取得了迄今为止最好的结果,显示出这种声学模型作为语音生物标志物研究的有希望工具。此外,性别识别的性能与英文的最先进模型相媲美。