ACLAug, 2021

LOT:面向叙事的中文长文本理解与生成基准评测

TL;DR为了评估和公平比较不同模型的长文本处理能力,我们提出了一个名为 LOT 的以故事为中心的基准测试,并发布了一个名为 LongLM 的编码器 - 解码器型中文长文本预训练模型,训练了两个生成任务和 120G 中文小说,LongLM 在 LOT 中表现出在不同理解和生成任务方面优异的性能,胜过同等规模的预训练模型。