关键词evaluations
搜索结果 - 28
- 大型语言模型真的是良好的逻辑推理者吗?从演绎、归纳和举例推理的综合评估PDFa year ago
- 现有端到端实体链接系统的公正深入评估PDFa year ago
- 使用模型编写的评价方法发现语言模型行为PDF2 years ago
- 面向人类中心的可解释人工智能:模型解释的用户研究PDF2 years ago
- 决策树学习的全球评估PDF2 years ago
- EMNLP非递增编码器时代的增量处理:双向模型在增量自然语言理解中的实证评估PDF4 years ago
- CVPR模仿:实现 GAN 研究的可复现性PDF4 years ago
- 迈向稳健的持续学习评估PDF6 years ago
Next