关键词comprehensive evaluation
搜索结果 - 13
- 大型语言模型在学生论文评价中的应用PDFa month ago
- 朝着真实的少样本关系抽取:新元数据集与评估PDF3 months ago
- COLINGLHMKE:用于中文大语言模型的大规模综合多学科知识评估基准PDF3 months ago
- ICLR剖析样本难度:对数据中心人工智能硬度表征方法的细粒度分析PDF4 months ago
- 基于 z 归一化和 NP-Free 的 k-means 时间序列聚类评估PDF5 months ago
- 在线视觉问答中 GPT-4V 和 Gemini 的评估PDF7 months ago
- 评估 ChatGPT 在自动代码生成中的优势和局限性PDF8 months ago
- 揭开未出生婴儿的面纱:通过机器学习推进胎儿健康分类PDF9 months ago
- L2CEval: 评估大型语言模型的语言到代码生成能力PDF9 months ago
- SafetyBench: 用多项选择题评估大型语言模型的安全性PDF10 months ago
- C-Eval: 一种基于多级多学科的中文评估套件,用于基础模型PDFa year ago
- 通过多精度评估高效搜索全面强鲁棒性神经结构PDFa year ago
- WWWGraphGen: 一种可伸缩的、与领域无关的带标签图形生成方法PDF4 years ago
Prev
Next