Sep, 2023

利用数据收集和无监督学习对突尼斯阿拉伯语混合语音自动识别的提升

TL;DR本研究旨在解决突尼斯方言语音识别的挑战,通过采集和注释文本和音频数据,并探索自监督、半监督和少样本代码转换方法,使其在不同的突尼斯测试集中取得前沿成果,最终通过人工评估确保翻译的准确性,所提出的模型适用于突尼斯阿拉伯语、英语和法语的语言混合,并提供训练和测试数据供公众使用和进一步改进。