Jan, 2022

临床长序列变压器:Clinical-Longformer 和 Clinical-BigBird

TL;DR该研究介绍了一种基于 Transformer 的语言模型,通过使用稀疏的注意机制来扩展最大输入序列长度,从而取得了在多项基准任务中超越 ClinicalBERT 和其他短序列变压器的显著成果。