Apr, 2020

超过512标记:Siamese多深度变形金刚分层编码器用于长篇文档匹配

TL;DR本文提出了一种用于匹配长文档的Siamese Multi-depth Transformer-based Hierarchical(SMITH)编码器,来解决长文档匹配的语义匹配问题,该编码器包含多项创新来适应输入文本的长度,其中包括使用速度更快的遮盖句块语言建模任务来更好地捕捉文档内的语义关系,实验结果表明SMITH在多个基准数据集的表现优于现有最先进的模型,最大输入文本长度从512扩展到2048。