BriefGPT.xyz
大模型
Ask
alpha
关键词
instruction evaluation benchmark
搜索结果 - 1
FollowIR: 评估和教授信息检索模型遵循指导
现代大型语言模型具备跟随长而复杂的指令以完成各种用户任务的能力。本研究引入了数据集 FollowIR,其中包含了严格的指令评估基准以及用于帮助信息检索模型学习更好地遵循真实世界指令的训练集。我们的结果表明现有的检索模型未能正确地使用指令,只
→
PDF
3 months ago
Prev
Next