Nov, 2022

BudgetLongformer:我们能否以低成本从头开始预训练SotA法律语言模型?

TL;DR通过Replaced Token Detection任务提高训练信号量,我们训练了Longformer模型来展示使用更少的计算力可以预训练高效的语言模型,并在长文本摘要任务上取得了很好的性能。