Jun, 2024

提高标准:通过生成进化测试研究大型语言模型的价值

TL;DR该研究提出了 GETA 这一新颖的生成动态测试方法,通过动态地探测大型语言模型(LLMs)的道德基准,生成难度匹配的测试项目,并更准确地评估 LLMs 的价值观,为未来的评估范式奠定基础。