May, 2024

CulturePark: 大型语言模型中跨文化理解的提升

TL;DR通过 CulturePark,我们生成了 41,000 个文化样本,用于优化八个特定文化的 LLM。我们在内容审查、文化协调和文化教育三个下游任务中评估了这些模型,结果表明在内容审查方面,基于 GPT-3.5 的模型要么与 GPT-4 相匹配,要么胜过它。在文化协调方面,我们的模型优于 GPT-4 的 Hofstede 的 VSM 13 框架。此外,针对人类参与者的文化教育,我们的模型在学习效果和用户体验方面与 GPT-4 相比展现了卓越的结果。CulturePark 是解决文化偏见和推动人工智能民主化的重要进展,突显了文化包容性数据在模型训练中的关键作用。