Nov, 2024

CAFE:一种新型阿尔及利亚方言法语与英语的代码切换数据集

TL;DR本文介绍并公开发布了CAFE,这是首个阿尔及利亚方言、法语和英语之间的代码切换数据集。该数据集通过捕捉自发对话中的代码切换和重叠发言,聚焦北非阿拉伯方言的独特语言挑战,显示出高效的数据处理和解码技术可以显著改善自动语音识别模型的性能,混合错误率达到0.310。