关键词implicit biases
搜索结果 - 16
  • 使用认识论偏见作为文本中不公正性的自动检测手段
    PDF7 days ago
  • 评估对隐含偏见进行无限生成的非裔女性的韵律和情感
    PDF14 days ago
  • 明示和隐示的大型语言模型角色生成意见,但无法复制更深层次的认知和偏见
    PDF25 days ago
  • 通过调整并对变化进行惩罚来减少预训练模型中的偏差
    PDF3 months ago
  • 在显式无偏的大型语言模型中测量隐性偏见
    PDF5 months ago
  • 大规模强化学习用于扩散模型
    PDF6 months ago
  • 在脱轨损失及其之外的动力学下
    PDF7 months ago
  • EMNLPPEFTDebias: 使用 PEFTs 捕捉去偏信息
    PDF7 months ago
  • 早期和晚期隐性偏见的二分法可以显然地引发 Grokking
    PDF8 months ago
  • 优秀的规则性形成大学习率的隐式偏差:稳定性、平衡和推动力的边界
    PDF9 months ago
  • RAFT: 用于生成式基础模型对齐的奖励排序微调方法
    PDFa year ago
  • 预训练语言模型中衡量代表性伤害的度量指标的实证研究
    PDFa year ago
  • EMNLP通过常识推理揭示叙述中的隐性性别偏见
    PDF3 years ago
  • 过度参数化模型中的核心和丰富区域
    PDF5 years ago
  • 深度神经网络在频域下的训练行为
    PDF6 years ago
  • Themis-ml:一种关注公平的机器学习接口,用于端到端的歧视发现和缓解
    PDF7 years ago
Prev
Next