BriefGPT.xyz
大模型
Ask
alpha
关键词
gameeval
搜索结果 - 1
GameEval:对话游戏下 LLM 的评估
通过目标驱动的对话游戏,GameEval 提出了一种新的评估大型语言模型的方法,能够全面评估模型的性能,展示其解决复杂问题的综合能力。
PDF
10 months ago
Prev
Next