BriefGPT.xyz
Apr, 2019
DocBERT:文件分类的BERT模型
DocBERT: BERT for Document Classification
HTML
PDF
Ashutosh Adhikari, Achyudh Ram, Raphael Tang, Jimmy Lin
TL;DR
本研究使用BERT进行文档分类,并展示出其在四个流行数据集上的最新成果。为了解决BERT推理的计算开销,研究者提出使用知识蒸馏技术,将BERT的知识转移到小型双向LSTM中,并使用30倍更少的参数达到了BERT-base相当的性能。该研究的主要贡献在于提高了基线水平,为未来的工作提供了基础。
Abstract
Pre-trained language representation models achieve remarkable
state of the art
across a wide range of tasks in natural language processing. One of the latest advancements is
bert
, a deep pre-trained transformer t
→