Sep, 2019

语言模型与自动化文章评分

TL;DR本文通过比较两种强大的语言模型 BERT 和 XLNet 以及传统模型(词袋和 LSTM),阐述了其神经网络架构,并使用线性代数符号和图表解释了 transformer 机制构架的优势,最终在 Kaggle AES dataset 中实现了超出人类水平的准确度。