Dec, 2022

视觉丰富文档的增强策略

TL;DR本论文提出了一种名为 FieldSwap 的数据增强技术,通过交换源领域的关键短语和目标领域的关键短语来生成新的合成例子,以提高培训中目标领域数据稀缺时的性能,例如文本处理和字段提取。实验证明,该方法可以提高 1-7 个 F1 点的提取性能。