Mar, 2024

测量和建模 LLMs 中的 “文化”: 一项调查

TL;DR对研究大型语言模型中文化表示和包容性的 39 篇最新论文进行概述,发现这些研究中没有明确定义 “文化”,而是通过一些特殊设计的数据集来探索模型,这些数据集代表了文化的某些方面;我们称这些方面为文化的代理,按人口统计学、语义和语言文化交互代理三个维度将其组织起来,并对使用的探测方法进行分类。分析表明,只有文化的某些方面,如价值观和目标,得到了研究,其他一些有趣且重要的方面,尤其是语义领域的多样性和主题向度,尚未被探索。另外,目前的方法缺乏鲁棒性和情境性。基于这些观察,提供了关于进一步促进 LLM 和基于 LLM 的应用中文化包容的全面可行的研究议程的几点建议。