EMNLPOct, 2023

GenKIE:鲁棒的生成多模态文档关键信息抽取

TL;DR提出了一种名为 GenKIE 的新型生成式端到端模型,利用多模态编码器嵌入视觉、版面布局和文本特征,并利用解码器生成所需的输出,从而解决了来自扫描文档的关键信息抽取任务。实验证明 GenKIE 能够有效泛化到不同类型的文档,并在 OCR 错误方面表现出鲁棒性,因此在实际场景中具有广泛的应用前景。