Nov, 2023

LongBoX:评估基于 Transformer 的长序列临床任务

TL;DR评估长序列处理能力的医学大型语言模型和模型性能,引入长序列数据集 LongBoX,初步实验证明医学和一般领域大型语言模型对长序列的处理存在困难,通过两种长序列处理技术(局部 - 全局注意力、Fusion-in-Decoder)的评估,得出虽然在某些数据集上分数有所提高,但仍有较大改进空间,并希望 LongBoX 有助于开发更有效的长序列技术。