Nov, 2022

BudgetLongformer:我们能否以低成本从头开始预训练 SotA 法律语言模型?

TL;DR通过 Replaced Token Detection 任务提高训练信号量,我们训练了 Longformer 模型来展示使用更少的计算力可以预训练高效的语言模型,并在长文本摘要任务上取得了很好的性能。