Jun, 2024

ArzEn-LLM: 使用 LLM 进行代码切换的埃及阿拉伯语 - 英语翻译和语音识别

TL;DR该研究以机器翻译和自动语音识别系统为基础,探索埃及阿拉伯语和英语的代码切换现象,并提供了关于开发这些系统的方法学,使用了 LLama 和 Gemma 等大规模语言模型。该研究实验了 Whisper 模型在代码切换的埃及阿拉伯语识别中的应用,详细介绍了数据预处理和训练技术等实验过程。通过将自动语音识别与机器翻译相结合的连续语音转文本翻译系统的实现,研究旨在克服有限资源和埃及阿拉伯语方言的独特特点所带来的挑战。通过与已有指标的评估,我们的方法在英语翻译方面取得了 56% 的显著提高和 9.3% 的阿拉伯语翻译提高。由于代码切换在口头语言中是根深蒂固的,自动语音识别系统能够有效处理这一现象至关重要。这种能力对于实现各个领域的无缝交流至关重要,包括商务谈判、文化交流和学术讨论。我们的模型和代码可作为开源资源使用。