May, 2024

面向长文档分类的长度感知多核心变换器

TL;DR长篇文档分类方面的研究中,我们提出了一种适应长文档的多核变换器(LAMKIT),通过使用多样化的基于变换器的核心来编码长篇文档,以解决上下文边界和文档长度差异性带来的问题,并通过这些核心向量化文本长度以提高模型的稳健性。在健康和法律领域的五个标准测试中,LAMKIT 相对于现有技术提升了高达 10.9% 的绝对改进。我们进行了大量的消融分析,以检验模型在不同文档长度上的稳健性和有效性。