Oct, 2022

评估文档图像分类器的越界性能

TL;DR本文提出了一个新的文档分类器 “out-of-distribution” 测试基准,名为 RVL-CDIP,目的是测试分类器在不同分布的输入上的健壮部署和泛化性能。该基准包括两种类型的文档:不属于任何 16 个领域的 RVL-CDIP-O 类别的文档和来自于与原始数据集不同的分布的 16 个领域内的 RVL-CDIP-N 类别的文档。通过评估,发现模型对于新的 out-of-domain RVL-CDIP-N 测试基准的准确率下降了约 15-30%,而且还很难区分领域内 RVL-CDIP-N 和领域外 RVL-CDIP-O 输入。