Jun, 2024
通过自适应取样实现大型语言模型和文本到图像模型的数据高效评估
Data Efficient Evaluation of Large Language Models and Text-to-Image Models via Adaptive Sampling
Cong Xu, Gayathri Saranathan, Mahammad Parwez Alam, Arpit Shah, James Lim...
TL;DRSubLIME 是一个数据高效评估框架,利用自适应采样技术,如聚类和质量导向方法,创建代表性的基准子集,以确保与完整数据集在模型排名方面具有高皮尔逊相关系数。该框架在评估低资源语言模型和文本到图像模型方面提供了一种灵活且经济高效的解决方案。