Skip to main content
QUICK REVIEW

[论文解读] Deep Learning for Secure Mobile Edge Computing

Yuanfang Chen, Yan Zhang|arXiv (Cornell University)|Sep 23, 2017
Advanced Malware Detection Techniques参考文献 9被引用 35
一句话总结

本文提出一种基于深度学习的模型,利用深度置信网络检测移动边缘计算(MEC)环境中的恶意应用程序,通过引入位置感知特征。该模型在10个数据集上平均准确率较现有最先进机器学习算法提升6%,相较于逻辑回归模型最高提升12.61%。

ABSTRACT

Mobile edge computing (MEC) is a promising approach for enabling cloud-computing capabilities at the edge of cellular networks. Nonetheless, security is becoming an increasingly important issue in MEC-based applications. In this paper, we propose a deep-learning-based model to detect security threats. The model uses unsupervised learning to automate the detection process, and uses location information as an important feature to improve the performance of detection. Our proposed model can be used to detect malicious applications at the edge of a cellular network, which is a serious security threat. Extensive experiments are carried out with 10 different datasets, the results of which illustrate that our deep-learning-based model achieves an average gain of 6% accuracy compared with state-of-the-art machine learning algorithms.

研究动机与目标

  • 应对移动边缘计算(MEC)环境中日益增长的恶意应用程序安全威胁。
  • 克服现有基于机器学习的检测方法未整合位置信息的局限性。
  • 通过利用无监督深度学习实现自动特征提取,提升检测准确率。
  • 实现实时、自动化的检测,识别位置感知攻击(如边缘设备地址欺骗和连接中断)。
  • 在具有不同类别不平衡的多样化数据集上,验证模型的鲁棒性与可扩展性。

提出的方法

  • 利用受限玻尔兹曼机(RBMs)进行无监督预训练的深度置信网络(DBN),从原始应用程序行为数据中自动学习特征。
  • 通过反向传播进行微调阶段,优化DBN以实现对恶意与良性应用程序的监督分类。
  • 将位置信息作为关键输入特征,以增强对边缘设备地址欺骗等位置感知攻击的检测能力。
  • 处理通过运行时监控收集的动态应用程序行为,包括网络连接、系统调用和资源使用情况。
  • 在预训练阶段使用无标签数据进行训练,微调阶段使用有标签数据以提升分类准确率。
  • 采用均方误差作为预训练损失,使用分类交叉熵作为微调损失,以优化特征学习与分类性能。

实验结果

研究问题

  • RQ1与传统机器学习方法相比,集成位置信息的深度学习模型是否能提升MEC环境中恶意应用程序的检测准确率?
  • RQ2训练数据集的大小如何影响所提出的基于深度学习的检测模型性能?
  • RQ3在移动应用程序安全背景下,使用RBMs进行无监督预训练在多大程度上能增强特征学习与分类性能?
  • RQ4该模型在多次训练迭代和多样化数据集上的检测性能是否稳定且一致?
  • RQ5为避免过拟合并最大化检测准确率,预训练与微调阶段的最佳训练周期(以预训练和微调的epoch数衡量)是什么?

主要发现

  • 所提出的深度学习模型在10个不同数据集上,平均准确率较现有最先进机器学习算法提升6%。
  • 与逻辑回归相比,准确率提升12.61%;与决策树相比提升5.76%;与支持向量机相比提升3.20%;与随机森林相比提升2.61%。
  • 随着训练数据集增大,模型性能进一步提升,且对数据量的依赖性明显强于基线算法。
  • 在10次迭代中,准确率分布显示所提模型的检测性能始终高于且更稳定于四种基线算法。
  • 预训练误差在50个epoch时达到最小值,表明在此时点前后特征学习达到最优,随后开始出现过拟合。
  • 微调损失在约350个epoch后趋于稳定,表明在此之后训练时长增加收益递减,且长期训练可能导致过拟合。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。