关键词chinese llms
搜索结果 - 8
  • CRiskEval:中文大型语言模型多级风险评估基准数据集
    PDFa month ago
  • FoundaBench: 评估大型语言模型在中文基础知识能力上的表现
    PDF2 months ago
  • FineMath:面向中文大语言模型的细粒度数学评估基准
    PDF4 months ago
  • 让 LLMs 应对最新挑战!一个中文动态问答基准测试
    PDF4 months ago
  • 用于评估大型语言模型中的保障措施的中文数据集
    PDF4 months ago
  • AAAICORECODE: 一个带有基准任务的常识注释对话数据集,用于中文大型语言模型
    PDF6 months ago
  • PromptCBLUE: 医学领域的汉语提示调优基准
    PDF8 months ago
  • SC-Safety:大语言模型中的多轮开放性问题对抗安全基准
    PDF9 months ago
Prev
Next