关键词comprehensive evaluation
搜索结果 - 13
  • 大型语言模型在学生论文评价中的应用
    PDFa month ago
  • 朝着真实的少样本关系抽取:新元数据集与评估
    PDF3 months ago
  • COLINGLHMKE:用于中文大语言模型的大规模综合多学科知识评估基准
    PDF3 months ago
  • ICLR剖析样本难度:对数据中心人工智能硬度表征方法的细粒度分析
    PDF4 months ago
  • 基于 z 归一化和 NP-Free 的 k-means 时间序列聚类评估
    PDF5 months ago
  • 在线视觉问答中 GPT-4V 和 Gemini 的评估
    PDF7 months ago
  • 评估 ChatGPT 在自动代码生成中的优势和局限性
    PDF8 months ago
  • 揭开未出生婴儿的面纱:通过机器学习推进胎儿健康分类
    PDF9 months ago
  • L2CEval: 评估大型语言模型的语言到代码生成能力
    PDF9 months ago
  • SafetyBench: 用多项选择题评估大型语言模型的安全性
    PDF10 months ago
  • C-Eval: 一种基于多级多学科的中文评估套件,用于基础模型
    PDFa year ago
  • 通过多精度评估高效搜索全面强鲁棒性神经结构
    PDFa year ago
  • WWWGraphGen: 一种可伸缩的、与领域无关的带标签图形生成方法
    PDF4 years ago
Prev
Next