May, 2024

基于 CNN 和训练动态的自动文本识别

TL;DR使用 Data Maps 对 AuTexTification 数据集进行建模和表征,通过训练过程中个体样本的行为洞察(训练动态)。我们通过自信度、可变性和正确性这三个维度表征样本,发现有三个区域:易学习、模糊和难学习的样本。我们使用经典的 CNN 架构发现仅在模糊样本子集上训练模型可以提高模型的分布外泛化能力。