EMNLPAug, 2023

AgentSims:用于大型语言模型评估的开放源码沙盒

TL;DR使用 AgentSims 构建任务评估方法,解决现有评估方法的局限性,并提供易于使用的基础设施,供研究人员测试大语言模型的能力。