May, 2023

多还是少的样本?比较加密流量分类中的迁移、对比和元学习

TL;DR研究了在流量分类领域中,如何通过使用代表性更强的表示来减少对大规模标注数据集的依赖性,通过比较迁移学习、元学习和对比学习,发现对比学习是最佳方法,而元学习最差,树状机器学习模型对于小任务适用,而深度学习方法正在通过复用学习表示达到与树状模型相同的性能水平。同时,通过两个公共数据集的实验验证了大数据集可以获得更一般性的表示。