关键词social biases
搜索结果 - 91
  • ACL孟加拉语的背景长度变化特征的实证研究
    PDF7 days ago
  • 全球好,本地不好?:了解 LLM 中的品牌偏见
    PDF12 days ago
  • 评估社交媒体数据和屏蔽语言模型中短期时间波动的社交偏见
    PDF13 days ago
  • 通过遗忘减缓语言模型中的社会偏见
    PDF13 days ago
  • 恶魔在神经元中:解释和减轻预训练语言模型中的社会偏见
    PDF18 days ago
  • 评估计算机视觉模型的社会技术视角:基于性别和情绪检测与推理的案例研究
    PDF20 days ago
  • 失败是命中注定的,但可以淡化:关于大规模视觉语言模型中的不良行为的特征化和缓解
    PDF21 days ago
  • 日本大型语言模型中社会偏见分析
    PDFa month ago
  • 用反事实推理发现大规模视觉 - 语言模型中的偏见
    PDFa month ago
  • ACLGPT 不是一个标注器:在公平性基准构建中人工标注的必要性
    PDFa month ago
  • 白人男性主导,黑人女性协助:揭示语言代理中的性别、种族和交叉偏见
    PDF3 months ago
  • CVPR深度生成模型是否会放大未来模型中的偏见?
    PDF3 months ago
  • 揭示大规模视觉语言模型中的偏见
    PDF3 months ago
  • IndiBias: 用于测量印度语境下语言模型社会偏见的基准数据集
    PDF3 months ago
  • 基于多任务指令调优与 RLAIF 的意图条件和无毒抗辩生成
    PDF4 months ago
  • 利用原型表示消除社会偏见而不包含人口统计信息
    PDF4 months ago
  • 通过预测质量的代理方法测量掩盖语言模型中的社会偏见
    PDF4 months ago
  • 自去偏大型语言模型:零样本识别和降低刻板印象
    PDF5 months ago
  • 机器语言模型中对齐和有用性之间的权衡
    PDF5 months ago
  • 基于余弦的词向量偏倚分数的语义属性
    PDF5 months ago
Prev