Aug, 2023

CLEVA:中文语言模型评估平台

TL;DR为解决当前评估中文大型语言模型的挑战,我们提出了 CLEVA,一个用户友好的平台,通过标准化的流程评估模型的性能,并定期更新排行榜。CLEVA 还通过策略性的数据采样来减少数据污染,并通过易于使用的界面和模型 API 使用户能够进行全面评估。大规模实验已验证 CLEVA 的有效性。