Jun, 2024

BeHonest:大型语言模型诚实度基准测试

TL;DR这篇论文介绍了一个名为 BeHonest 的新基准,旨在全面评估大型语言模型(LLMs)的诚实性,并强调了 LLMs 诚实性对现实世界的影响和迫切需要可靠方法和基准来确保和评估 LLMs 的诚实性。