BriefGPT.xyz
Ask
alpha
关键词
multi-ability assessment
搜索结果 - 1
M4LE: 一个适用于大型语言模型的多能力多范围多任务多领域长上下文评估基准
我们提出了一个针对大型语言模型的多能力、多范围、多任务、多领域的长上下文评估基准(M4LE),并通过在 36 个 NLP 数据集、11 种任务类型和 12 个领域中用多样的 NLP 任务池来支持它。我们的研究揭示了当前的大型语言模型在理解长
→
PDF
8 months ago
Prev
Next