Jun, 2024

Open-LLM-Leaderboard:LLM模型评估、基准和竞赛中由多项选择题到开放式问题的转换

TL;DR通过完全开放式问题的方法,本研究解决了多项选择题中选择偏好和随机猜测的问题,并建立了新的语言模型评估基准。