Jun, 2023

重新思考模型评估作为缩小社会技术差距的一种方式

TL;DR在这篇论文中,作者认为生成模型和大型语言模型(LLM)的发展给模型评估带来了新的挑战与责任,因此呼吁研究人员应开发基于真实世界的社会需求的评估方法,并兼顾现实与成本的平衡,以缩小模型使用中的社会技术差距,同时为大型语言模型的评估提供开放性问题和机会。