Oct, 2019

层级 Transformer 用于长文档分类

TL;DR该研究介绍了如何通过引入基于循环层或其他 Transformer 的单输出层对长文本进行 BERT 模型的微调,成功将其应用于客户电话满意度预测和话题分类任务中,并在两个任务中取得了显著的改进。