Jun, 2024

LongIns: 一个对 LLMs 具有挑战性的基于长文本上下文的考试

TL;DR利用 LongIns benchmark dataset 在长背景下评估大型语言模型的推理性能及上下文窗口长度对其表现的影响。