Dec, 2021

ALP: 使用带词汇的PCFG进行数据增强,用于少样本文本分类

TL;DR使用词汇化的概率上下文无关语法(ALP)的数据增强技术可以生成具有合理语法的各种语法结构样本,该方法不需要特定的领域专家来处理依赖性和成分,当该数据扩充方法与增量的训练和验证集拆分策略同时发挥作用,可以获得用于小样本文本分类任务的强大的训练策略。