Aug, 2023

面向严重资源匮乏语言的数据生成:GPT-3.5 的协助来自 Google 翻译

TL;DR我们探讨了语言生成任务中,训练数据严重不足的情况下,GPT 等 LLM 模型如何处理爱尔兰语、马耳他语、威尔士语和布列塔尼语等语言。我们测试了多种提示类型和格式,发现少量样本训练对于直接生成不常见语言较为有效,但通过英语进行翻译后的生成差距不大。在 WebNLG 2023 中,我们的系统在所有语言和指标上均显著优于其他竞争系统,表现出令人满意的效果。然而,我们在威尔士语中表现最好的结果仍远低于 WebNLG'20 中最差的英语系统。