Jul, 2023

LaFiCMIL:从相关多示例学习的视角重新思考大型文件分类

TL;DR利用 Transformer-based 模型作为特征提取器,我们提出的 LaFiCMIL 方法在各种大文件分类任务中,包括二分类、多类别分类和多标签分类任务,跨越了自然语言处理、编程语言处理和 Android 分析等多个领域,在克服输入限制问题方面取得了出色的性能表现,并在八个基准数据集上实验结果表明,相比单个 Tesla V-100 GPU 的 32G 内存限制下,我们能将 BERT 扩展到近 20K 的令牌数量。