BriefGPT.xyz
Ask
alpha
关键词
stereotypical bias
搜索结果 - 3
种姓主义但非种族主义?量化印度与西方大型语言模型偏见的差异
对大型语言模型的研究发现,它们往往存在社会偏见,尤其在印度和西方语境下,而引入一种称为 Instruction Prompting 的简单干预方法能够显著减少这种偏见。
PDF
10 months ago
KDD
不同语言中的典型偏见有多大差异?
通过系统地分析使用不同语言、单语和多语模型、不同架构的偏向性,扩展了评估预训练英语语言模型中的刻板偏见的研究范围,发现在多语言环境下分析是非常重要的,并且公布了代码库以及翻译数据集的实用指南以鼓励将我们的工作进一步扩展到其他语言。
PDF
a year ago
不要忘记代词:消除语言模型中的性别偏见,同时保留事实性别信息
本研究探讨大型语言模型中的性别信号,并重点关注英语文本中的两种信号类型:事实性性别信息和性别偏见,在保留事实性性别信号的同时试图减弱刻板印象。研究发现,可以通过过滤方法减少性别中立的专业名称的刻板印象,而不会对语言建模能力造成显着的恶化。这
→
PDF
2 years ago
Prev
Next