Lens：网络流量的基础模型

Feb, 2024

Lens: A Foundation Model for Network Traffic

Qineng Wang, Chen Qian, Xiaochang Li, Ziyu Yao, Huajie Shao

TL;DR网络流量分析具有独特的挑战，因为数据包具有异构标头和缺乏语义的加密负载。为了更好地学习大规模网络流量的表示，本研究基于Transformer编码器的T5架构开发了Lens模型，并采用了一种新的损失函数，整合了三个任务：遮蔽跨度预测、数据包顺序预测和同源流量预测。在多个基准数据集上对Lens进行的评估结果显示，它在与网络流量相关的大多数下游任务中优于基准方法，在微调时所需的标记数据也明显较少。

Abstract

network traffic refers to the amount of information being sent and received over the internet or any system that connects computers. Analyzing and understanding network traffic is vital for improving network secu

发现论文，激发创造

使用预训练的Transformer生成上下文感知的数据报文表示，用于加密流量分类：ET-BERT

本文提出了一种新颖的流量表示模型称为ET-BERT，该模型在大规模未标记的数据上对Deep contextualized datagram-level进行预训练，然后在少量特定任务的有标签数据上进行微调，取得了在五个加密流量分类任务上的最新成果，尤其是在ISCX-Tor任务上的99.2％的F1分数所达到的显着的提高是本文的重点，作者解释了预训练模型的强力原因，并分析了加密流量之间边界的分类能力，为未来的研究和应用提供了新的思路。

Feb, 2022

NetGPT：面向网络流量的生成式预训练Transformer

本文提出了一种用于网络流量理解和生成任务的生成预训练模型，优化了适应预训练模型到多样化任务的效果，并在一系列流量理解和生成任务中展现了其显著的有效性，显著优于现有技术方案。

Apr, 2023

倾听少数族裔：用对比式预训练进行不平衡类别的加密流量分类

提出了一种新型的预训练半监督加密流量分类框架（PASS），通过重采样原始训练数据集、对相似流量样本进行对比预训练和结合伪标签迭代和动态损失加权算法的半监督优化策略，以解决流量类别不平衡和流量同质性等问题，在四个公开数据集上表现出色，显著提升了Cross-Platform215和ISCX-17的分类性能。同时验证了PASS中对比预训练和伪标签迭代组件的普适性，可以适应不同特征提取器的加密流量分类方法。

Aug, 2023

NetDiffus：基于扩散模型的网络流量生成与时序图像

利用扩散模型(Diffusion Models)和NetDiffus，将一维时间序列网络流量数据转换为二维图像，并生成代表原始数据的合成图像，以提高生成数据的保真度和机器学习任务的性能。在七个不同的流量追踪数据实验中评估NetDiffus，并证明利用合成数据显著改善了流量指纹识别、异常检测和流量分类。

Sep, 2023

ServeFlow: 用于网络流量分析的快慢模型架构

该论文介绍了ServeFlow，一个针对网络流量分析任务的机器学习模型服务解决方案，它通过仔细选择收集数据包的数量和应用于各个流量的模型，实现最小延迟、高服务速率和高准确性之间的平衡。

Feb, 2024

一个训练实现两个任务的框架：使用监督对比学习的加密流量分类

在本文中，我们提出了一种名为对比学习增强时域融合编码器（CLE-TFE）的有效模型，通过使用监督对比学习增强数据包级别和流级别的表示，并对字节级流量图进行图数据增强，以捕捉字节之间的细粒度语义无关特性。我们还提出了跨级多任务学习，使用同一模型在一个训练中同时完成数据包级别和流级别的分类任务。进一步的实验表明，CLE-TFE在两个任务上实现了最好的整体性能，而其计算开销（即浮点运算次数，FLOPs）仅为预训练模型（例如ET-BERT）的1/14。我们在此https URL上发布了代码。

Feb, 2024

TrafficGPT：突破标记壁垒的高效长程交通分析与生成

TrafficGPT是一个使用生成预训练模型和线性注意力机制解决长流分类和生成任务中的复杂挑战的深度学习模型，在分类任务中表现出卓越性能并达到了最新水平，在生成任务中，它与真实流量非常相似，并以低的JS散度和接近0.5的F1分数（代表随机猜测）区分生成的数据。

Mar, 2024

网络流量分析的通用多模式表示学习

网络流量分析是网络管理、故障排除和安全性的基础。本文提出了一种基于多模态自动编码器（MAE）的深度学习（DL）体系结构，用于解决不同的流量分析任务，其中包括流量分类（TC）任务。研究结果表明，MAE体系结构在TC任务中能够与现有解决方案相媲美甚至更好，同时避免了繁琐的特征工程，从而简化了采用DL方法进行流量分析的过程。

May, 2024

NetMamba：通过预训练单向 Mamba 实现高效的网络流量分类

网络流量分类是一个重要的研究领域，追求提升服务质量、简化网络管理和加强网络安全。NetMamba是一个高效的线性时间状态空间模型，具备全面的流量表示方案，以应对传输加密技术不断复杂化带来的挑战，并利用改进后的Mamba架构取代Transformer，实现了更高的效率和准确性。

May, 2024

面向网络流量分析的图基基础模型

本研究解决了当前网络流量分析中模型适应性不足的问题，提出了一种新的图基流级模型，通过构建动态时空图与自监督链路预测预训练任务，捕捉网络流量的空间和时间动态。研究表明，该方法在入侵检测、流量分类和恶意软件分类三项任务中，经过预训练的模型相较于从头训练平均提升了6.87%的性能，展示了其作为操作基础模型的潜力。

Sep, 2024