Oct, 2022

LittleBird:高效、更快、更长的问答 Transformer 模型

TL;DR提出了一个新模型 LittleBird,它是基于 BigBird 的改进版本,使用 Attention with Linear Biases(ALiBi)的更灵活、高效的位置表示方法,维护了准确性的同时,在速度和内存占用方面进行了优化。实验证明,LittleBird 在各种语言中表现良好,在特定的 KorQuAD2.0 数据集中,在长段落问答任务中取得了高精度