构建知识引导的词汇表以建模文化差异
通过从维基百科文献到链接页面的导航,建立文化知识的多元多样化采集方法与 CultureAtlas 数据集,该数据集涵盖了各种亚国家地理区域和族群,用于评估语言模型在文化多元背景下的表现和开发具有文化敏感和意识的语言模型,以促进数字领域中全球文化的更具包容性和平衡的表达。
Feb, 2024
对研究大型语言模型中文化表示和包容性的 39 篇最新论文进行概述,发现这些研究中没有明确定义 “文化”,而是通过一些特殊设计的数据集来探索模型,这些数据集代表了文化的某些方面;我们称这些方面为文化的代理,按人口统计学、语义和语言文化交互代理三个维度将其组织起来,并对使用的探测方法进行分类。分析表明,只有文化的某些方面,如价值观和目标,得到了研究,其他一些有趣且重要的方面,尤其是语义领域的多样性和主题向度,尚未被探索。另外,目前的方法缺乏鲁棒性和情境性。基于这些观察,提供了关于进一步促进 LLM 和基于 LLM 的应用中文化包容的全面可行的研究议程的几点建议。
Mar, 2024
本文介绍了一种从庞大的非结构化语料库中提取高质量文化相关调优数据集的新型流程。通过自我生成流程识别文化概念和触发指令,并与通用指令调优数据集相结合,我们的模型展示出了较强的识别和理解区域文化细微差别的能力,从而增强了其推理能力。我们在新加坡、菲律宾和美国三个地区开展了实验,取得了高达 6% 的性能改进。我们的研究为直接从非结构化数据中提取文化指令调优集开辟了新的途径,并为未来在该领域的创新设立了先例。
May, 2024
提出了一种经济高效的解决方案 CultureLLM,利用 World Value Survey (WVS) 作为种子数据,通过提议的语义数据增强方法生成语义上等价的训练数据,然后使用这些数据对文化特定的 LLMS 进行微调,以及一个统一模型 (CultureLLM-One) 来覆盖 9 种文化。实验结果表明 CultureLLM 在各种文化相关数据集上的性能明显优于其他对比模型,例如 GPT-3.5(8.1%)和 Gemini Pro(9.5%),且与 GPT-4 相当甚至更好。人类研究结果显示生成的样本在语义上与原样本相等,为 LLMs 的增强提供了有效的解决方案。
Feb, 2024
通过调查人类社会学的实际问卷与模型响应的对比,我们的研究发现,大型语言模型 (LLMs) 在两个维度上表现出更高的文化一致性,即当以特定文化的主要语言作为提示时,以及当使用该文化所采用的多语言精炼混合体系进行预训练时,对于模拟调查的不同人物与敏感社会议题,模型的文化一致性更加重要。最后,我们引入了人类学提示的创新方法,利用人类学推理增强文化一致性。我们的研究强调了更平衡的多语言预训练数据集对于更好地代表人类经验多样性和不同文化的复数性,对于跨语言传递的影响的必要性。
Feb, 2024
该研究探讨了视觉 - 语言模型中的文化和社会经济多样性,研究发现了数据训练过程中对低社会经济地位社群和文化理解的不公平现象,并提出了一种改进方法以提高文化多样性。
May, 2024
本文通过全面评估最有影响力的最新大型语言模型(LLMs)在机器翻译和自动语音识别两个高使用频率应用领域上的功能,对多个高和低资源语言的地区方言进行了功能评估,并分析了地方方言差距与经济、社会和语言因素的相关性,从而为方言 NLP 领域的发展奠定基础,并通过有意识的数据收集,揭示明显的差异并寻找可能的解决途径。
Oct, 2023
通过对 110 个国家和地区的 8 个与文化有关的主题的文化条件生成,以及从这些生成中提取与每个文化相关的符号,我们发现文化条件生成由区分边缘文化与默认文化的语言 “标记” 组成,而且发现 LLM 在文化符号的多样性方面存在不平衡,并且来自不同地理区域的文化在 LLM 的文化无关生成中存在不同的存在。我们的发现促进了进一步研究 LLM 中全球文化知识和公平感知的研究。
Apr, 2024
通过引入 GlobalRG 基准,涵盖了检索跨文化图像的普遍概念和在图像中定位文化特定概念这两个具有挑战性的任务,我们评估了各种模型在不同文化背景下的表现,并强调了在视觉语言模型中增强多元文化理解的必要性。
Jun, 2024