May, 2022

联合学习跨度抽取与序列标注,用于商务文档信息提取

TL;DR本文介绍了一种新的信息抽取模型,能够同时处理长文档和稀疏信息,通过跨度抽取和序列标注两种方法的结合来进行训练和优化,实验结果表明该模型在英语和日语的四个商业数据集上取得了良好的结果,速度也比标准跨度抽取方法更快。