Skip to main content
QUICK REVIEW

[论文解读] Nethira: A Heterogeneity-aware Hierarchical Pre-trained Model for Network Traffic Classification

Chungang Lin, Weiyao Zhang|arXiv (Cornell University)|Jan 30, 2026
Internet Traffic Analysis and Secure E-voting被引用 0
一句话总结

Nethira 引入了一种面向异质性的层级预训练模型,通过多级重建和一致性正则化微调,在有限标注数据下实现卓越性能。

ABSTRACT

Network traffic classification is vital for network security and management. The pre-training technology has shown promise by learning general traffic representations from raw byte sequences, thereby reducing reliance on labeled data. However, existing pre-trained models struggle with the gap between traffic heterogeneity (i.e., hierarchical traffic structures) and input homogeneity (i.e., flattened byte sequences). To address this gap, we propose Nethira, a heterogeneity-aware pre-trained model based on hierarchical reconstruction and augmentation. In pre-training, Nethira introduces hierarchical reconstruction at multiple levels-byte, protocol, and packet-capturing comprehensive traffic structural information. During fine-tuning, Nethira proposes a consistency-regularized strategy with hierarchical traffic augmentation to reduce label dependence. Experiments on four public datasets demonstrate that Nethira outperforms seven existing pre-trained models, achieving an average F1-score improvement of 9.11%, and reaching comparable performance with only 1% labeled data on high-heterogeneity network tasks.

研究动机与目标

  • 在同质输入形式下仍然存在流量异质性时,推动改进的网络流量分类。
  • 开发一个能够捕捉层级流量结构(字节、协议、数据包)的预训练任务。
  • 提出带有层级增强和一致性正则化的微调策略。
  • 证明层级预训练结合增强在多数据集和不同数据-标签情形下具有更优的性能。

提出的方法

  • 将原始流量转换为扁平化的字节序列作为模型输入。
  • 在字节、协议和数据包层级进行层级重建,使用 Transformer 编解码器进行预训练。
  • 使用三种重建损失:字节级、协议级和数据包级来引导表征学习(L_byte、L_protocol、L_packet)。
  • 预训练目标 L_P 等于三种重建损失之和(L_byte + L_protocol + L_packet)。
  • 通过带有一致性正则化的多层级流量增强进行微调(协议级和数据包级),以在异质输入上实现稳定预测(L_sup + lambda * L_cons)。

实验结果

研究问题

  • RQ1层级重建是否能捕捉超越扁平字节表示的流量异质性?
  • RQ2带有一致性正则化的层级增强是否改善对异质流量任务的泛化?
  • RQ3Nethira 相较于现有的预训练模型在多个公开数据集上的表现如何?
  • RQ4使用有限标注数据(如 1%–10%)时的数据效率提升是多少?

主要发现

MethodISCX-VPN(App) PRISCX-VPN(App) RCISCX-VPN(App) F1ISCX-VPN(Service) PRISCX-VPN(Service) RCISCX-VPN(Service) F1USTC-TFC PRUSTC-TFC RCUSTC-TFC F1CIC-IoT PRCIC-IoT RCCIC-IoT F1Avg. F1
FlowPrint59.0443.0444.9470.2166.6264.5169.7670.1668.8114.7320.4615.7048.49
AppScanner72.8953.6158.0385.9975.6779.1375.5857.7262.7735.2723.8625.4556.35
FS-Net49.9039.9640.6071.6163.6364.1890.7489.6689.3937.2435.3932.6156.70
EBSNN66.0761.5362.0589.8489.6989.5393.4891.2990.1088.9287.2985.3781.76
TFE-GNN67.2060.6061.8085.9780.9582.1495.9195.6895.6367.0566.9064.2975.97
NetMamba67.1758.0560.3286.0178.3180.2795.8594.9094.8368.1870.3967.5575.74
YaTC70.0358.7362.3381.0678.3778.0695.7794.9694.8774.2875.0772.3676.91
PERT72.1670.2670.8091.4290.4390.8693.2493.0092.9589.5889.4788.2385.71
NetGPT69.8671.4869.4091.9492.2091.9296.1695.9896.0090.4890.1989.0886.60
ET-BERT72.0070.3670.9491.4091.5891.4795.2195.2095.1891.2989.9388.9186.63
TraGe71.3871.1070.9391.7591.7291.6895.9495.9095.9189.0290.0488.6186.78
TrafficFormer72.3271.5671.6992.1591.9491.9795.1794.9895.0191.2590.1089.1286.95
Nethira77.3374.5875.5592.3592.4492.3496.6296.4296.4097.2697.4097.2990.40
  • Nethira 在七个预训练基线之上实现平均 F1 提升 9.11%。
  • 在四个数据集上,Nethira 相对于基线在 F1 上分别提升 11.49%(App)、5.36%(Service)、1.52%(USTC-TFC)、以及 18.05%(CIC-IoT)。
  • 仅用 1% 标注数据,Nethira 达到 CIC-IoT 的 F1 为 0.9452,达到或超过一些使用全标注训练的模型。
  • 消融实验显示若不进行层级重建的预训练,性能下降 4.78%;仅使用 L_byte 时下降 1.71%;无增强的微调下降 7.84%。
  • 在有限标签条件下,Nethira 的 CIC-IoT 数据集显示出显著提升,原因是数据包层级异质性较高(与 ANPF 相关效应)。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。