关键词mitigation
搜索结果 - 26
  • 基于梯度的模型修剪消除后门攻击
    PDF2 months ago
  • 在大型语言模型中定位和缓解性别偏见
    PDF3 months ago
  • 无监督概念发现减轻虚假相关性
    PDF4 months ago
  • 大型视觉语言模型中的幻觉调查
    PDF5 months ago
  • 黑暗之后的黎明:大型语言模型中的事实错觉的实证研究
    PDF6 months ago
  • 打破定型:一个统一框架用于审视推荐系统中的误判、偏见和刻板印象
    PDF6 months ago
  • 缓解联邦学习中的数据注入攻击
    PDF7 months ago
  • 纠正和回溯法减少总结中的幻觉
    PDF8 months ago
  • AI 海洋中的塞壬之歌:大型语言模型中的幻觉调查
    PDF10 months ago
  • 及时处理,节省九倍:通过验证低置信度生成结果来检测和减轻 LM 的幻觉
    PDFa year ago
  • LLM 集成应用的提示注入攻击
    PDFa year ago
  • 大型语言模型的自相矛盾幻觉:评估、检测和缓解
    PDFa year ago
  • CVPR模型无关性别去偏见图像描述
    PDFa year ago
  • 任务相似性对后门攻击和检测的影响理解
    PDF2 years ago
  • ACL事实” 的生命周期:知识图谱中社会偏见的调查
    PDF2 years ago
  • 通过解释发现和修复虚假模式
    PDF3 years ago
  • 社交媒体时代打击虚假信息
    PDF4 years ago
  • 一个众包平台上的机器学习模型是否会表现出偏见?模型公正性的实证研究
    PDF4 years ago
  • 知识蒸馏的有效性
    PDF5 years ago
  • EMNLP探讨具有语法性别的语言中的性别偏见
    PDF5 years ago
Prev