Sep, 2022
CNN-Trans-Enc:静态BERT表示之上的CNN增强Transformer编码器用于文档分类
CNN-Trans-Enc: A CNN-Enhanced Transformer-Encoder On Top Of Static BERT
representations for Document Classification
TL;DR提出一种使用Convolutional Neural Networks生成QKV特征映射的CNN-Enhanced Transformer-Encoder模型,该模型在不fine-tuning BERT的情况下利用所有层的$[CLS]$表示进行训练,从而提高不同语言特征的泛化表示,并在多个数据集上得到比当前最先进的结果更好的结果。