Jan, 2024

交通分类的数据增强

TL;DR数据增强(DA)在计算机视觉(CV)和自然语言处理(NLP)领域被广泛采用以提高模型性能,然而在网络环境中,尤其是在流量分类(TC)任务中,数据增强一直存在问题。本文通过对 3 个 TC 数据集使用数据包时间序列作为输入表示,并考虑多种训练条件,基准测试了 18 种增强函数,结果显示(i)DA 可以获得以前未探索的优势,(ii)基于时间序列顺序和掩码的增强函数更适用于 TC,(iii)简单的潜在空间分析可以提供有关增强效果的线索。