Dec, 2019

文件分类的模块化多模态架构

TL;DR文本和图像内容均可用于页面分类,该方法在 RVL-CDIP 基准测试中实现了 93.03% 的准确率,超过了当前技术水平。