EMNLPJan, 2023

Mask-then-Fill: 一种用于事件抽取的灵活有效的数据增强框架

TL;DR本文提出了一个名为 Mask-then-Fill 的灵活有效的数据增强框架,可以在保持原有事件结构不变的前提下更灵活地操作文本以生成更加多样化的数据。该方法可以用更多种类的文本替换原有文本,相比现有的方法,它可以替换任意长度的一段文本而非仅单个词或固定长度的文本片段,因此在触发词和参数提取任务中比基线方法表现更好,并在低资源情况下表现尤为强大。我们进一步分析结果显示,该方法在多样性和分布相似性之间达到了良好的平衡。