Sep, 2021

从合成数据中采样结构多样的训练集,以寻找干草堆中的针

TL;DR本文研究了使用自动生成的合成语言-程序组对来改善语义解析中组合泛化的问题,通过使用具有结构多样性的样本,我们获得了在数据效率方面200倍的提高,并且在schema2QA数据集上,模型在组合泛化方面取得了显著的提高和在传统的i.i.d设置下取得了适度的提高。