Jun, 2024

语言模型委员会:以共识的方式对高度主观任务进行基准测试基础模型

TL;DR通过民主过程提出了一种新的基准框架 —— 语言模型委员会(LMC),用于在高度主观的任务中对大型语言模型进行排名,通过平等参与来制定测试集,通过集体评估响应来产生更可分离、强健且较少偏差的排名。