Apr, 2020

跨片段关注的文本分割

TL;DR本研究提出三种基于 Transformer 的架构,并在三个标准数据集上进行全面比较,建立了一个新的最先进水平,在所有情况下特别是大幅减少了误差率。研究还分析了模型大小,并发现能够构建具有更少参数但保持良好性能的模型,从而促进了实际应用。