May, 2023

深度学习中针对表格数据的数据增强策略重新审视

TL;DR本文提出了一种名为 $ extbf {M}$ask $ extbf {T}$oken $ extbf {R}$eplacement ($ exttt {MTR}$) 的数据增广方法,利用 Transformer 的特性对每个列嵌入进行数据增广来提高模型性能。通过在 13 个各异的公共数据集中运行受监督和自监督的学习场景,我们表明 $ exttt {MTR}$ 相对于现有数据增广方法具有竞争性能,并改善了模型性能。此外,还讨论了 $ exttt {MTR}$ 最有效的特定场景,并确定了其应用范围。