Jul, 2023

Disco-Bench: 一种考虑语篇的语言模型评估基准

TL;DR该论文提出了一个可以评估处理自然语言时的句子内语篇特征的精细化预训练模型,该模型包含 9 个文献领域的测试集,涵盖了许多超出了跨句子属性的问题。