关键词evaluations
搜索结果 - 28
  • 大型语言模型真的是良好的逻辑推理者吗?从演绎、归纳和举例推理的综合评估
    PDFa year ago
  • 现有端到端实体链接系统的公正深入评估
    PDFa year ago
  • 使用模型编写的评价方法发现语言模型行为
    PDF2 years ago
  • 面向人类中心的可解释人工智能:模型解释的用户研究
    PDF2 years ago
  • 决策树学习的全球评估
    PDF2 years ago
  • EMNLP非递增编码器时代的增量处理:双向模型在增量自然语言理解中的实证评估
    PDF4 years ago
  • CVPR模仿:实现 GAN 研究的可复现性
    PDF4 years ago
  • 迈向稳健的持续学习评估
    PDF6 years ago
Next