Nov, 2022

TRAC: 一个关于动作和变化推理的文本基准

TL;DR使用基于Transformer的语言模型,针对行动与变化的推理问题提出了TRAC基准测试,该测试提供了各种复杂性的问题,旨在更加精准地评估模型的结构泛化能力。实验结果表明,需要额外努力来解决TRAC带来的挑战。