Sep, 2024

LexEval:评估大型语言模型的综合中文法律基准

TL;DR本研究针对现有大型语言模型在法律应用中的准确性、可靠性和公平性不足的问题,提出了一个新的中文法律评估基准LexEval。该基准不仅涵盖了23个任务和14,150个问题,还引入了一种新的法律认知能力分类法,全面评估LLMs,并探讨了其应用中的伦理问题。研究发现对中国法律系统的发展和LLM评估管道提供了重要的见解。