BriefGPT.xyz
Ask
alpha
关键词
interactive gui
搜索结果 - 1
EMNLP
AgentSims:用于大型语言模型评估的开放源码沙盒
使用 AgentSims 构建任务评估方法,解决现有评估方法的局限性,并提供易于使用的基础设施,供研究人员测试大语言模型的能力。
PDF
a year ago
Prev
Next