Sep, 2022

SkIn: 使用 BERT 进行文本分类的医学语料库的快速筛选

TL;DR本文提出了一种名为 Skimming-Intensive Model (SkIn)的方法,通过模拟人类阅读长段落时的高效阅读方法,动态选择文本中的关键信息,从而缩短输入 BERT 模型的句子长度,有效降低分类算法的成本,该方法在医疗领域的长文本分类数据集上已经取得了比基线更优秀的准确性,同时其时间和空间要求随着文本长度的增加呈线性增长,缓解了基本 BERT 在长文本数据上的时间和空间溢出问题。