关键词performance differences
搜索结果 - 8
  • EnviroExam: 大型语言模型的环境科学知识基准测试
    PDF2 months ago
  • 量化语言模型对触发设计中伪特征的敏感性,或:我如何开始担忧触发格式
    PDF9 months ago
  • 评估大型语言模型的推理能力
    PDF10 months ago
  • MMFood-500 Cap:用于评估视觉语言模型的细粒度食物标题基准
    PDFa year ago
  • 差分隐私对群体不平等性缓解的影响
    PDF2 years ago
  • EMNLP章鱼的世界:报道偏见如何影响语言模型对颜色的感知
    PDF3 years ago
  • 比较单个性能得分并不能得出关于机器学习方法的结论
    PDF6 years ago
  • 卷积字典学习:一次比较评估和新算法
    PDF7 years ago
Prev
Next