Dec, 2023
Catwalk: 一个统一的语言模型评估框架
Catwalk: A Unified Language Model Evaluation Framework for Many Datasets
Dirk Groeneveld, Anas Awadalla, Iz Beltagy, Akshita Bhagia, Ian Magnusson...
TL;DRCatwalk 是一个解决大规模自然语言处理模型评估和对比的工程挑战的统一接口,它能简化构建数据集和模型的过程,并提供易于扩展的抽象层,使得在大规模环境下进行有控制的实验变得更加容易。