关键词chinese llms
搜索结果 - 8
- CRiskEval:中文大型语言模型多级风险评估基准数据集PDFa month ago
- FoundaBench: 评估大型语言模型在中文基础知识能力上的表现PDF2 months ago
- FineMath:面向中文大语言模型的细粒度数学评估基准PDF4 months ago
- 让 LLMs 应对最新挑战!一个中文动态问答基准测试PDF4 months ago
- 用于评估大型语言模型中的保障措施的中文数据集PDF4 months ago
- AAAICORECODE: 一个带有基准任务的常识注释对话数据集,用于中文大型语言模型PDF6 months ago
- PromptCBLUE: 医学领域的汉语提示调优基准PDF8 months ago
- SC-Safety:大语言模型中的多轮开放性问题对抗安全基准PDF9 months ago
Prev
Next