Oct, 2023

JudgeLM:经过优化的大型语言模型是可扩展的法官

TL;DR通过对大规模语言模型进行微调以构建可扩展的评判模型,提出了一种有效评估大规模语言模型的方法,并成功应用于新的基准测试中,获得了最佳表现。