Aug, 2023

倾听少数族裔:用对比式预训练进行不平衡类别的加密流量分类

TL;DR提出了一种新型的预训练半监督加密流量分类框架(PASS),通过重采样原始训练数据集、对相似流量样本进行对比预训练和结合伪标签迭代和动态损失加权算法的半监督优化策略,以解决流量类别不平衡和流量同质性等问题,在四个公开数据集上表现出色,显著提升了Cross-Platform215和ISCX-17的分类性能。同时验证了PASS中对比预训练和伪标签迭代组件的普适性,可以适应不同特征提取器的加密流量分类方法。