关键词performance differences
搜索结果 - 8
- EnviroExam: 大型语言模型的环境科学知识基准测试PDF2 months ago
- 量化语言模型对触发设计中伪特征的敏感性,或:我如何开始担忧触发格式PDF9 months ago
- 评估大型语言模型的推理能力PDF10 months ago
- MMFood-500 Cap:用于评估视觉语言模型的细粒度食物标题基准PDFa year ago
- 差分隐私对群体不平等性缓解的影响PDF2 years ago
- EMNLP章鱼的世界:报道偏见如何影响语言模型对颜色的感知PDF3 years ago
- 比较单个性能得分并不能得出关于机器学习方法的结论PDF6 years ago
- 卷积字典学习:一次比较评估和新算法PDF7 years ago
Prev
Next