BriefGPT.xyz
大模型
Ask
alpha
关键词
cs-bench
搜索结果 - 1
CS-Bench: 大型语言模型的全面基准,助力计算机科学掌握
计算机科学(CS)是人类智能复杂性的证明,深刻推动了人工智能和现代社会的发展。我们引入 CS-Bench,这是第一个专门用于评估 LLM 在计算机科学领域性能的双语(中英文)基准,包括大约 5K 个精心策划的测试样本,涵盖计算机科学的 4
→
PDF
22 days ago
Prev
Next