BriefGPT.xyz
大模型
Ask
alpha
关键词
nlpbench dataset
搜索结果 - 1
NLPBench:评估大型语言模型在解决 NLP 问题上的能力
通过独特的基准数据集 NLPBench,评估了大型语言模型在自然语言处理中的问题解决能力,并发现高级提示策略的有效性不稳定,对 LLMs 性能有时造成损害,尤其是较小的模型 LLAMA-2(13 亿参数)中表现更明显;同时发现大型语言模型在
→
PDF
9 months ago
Prev
Next