[论文解读] A Holistic View on Data Protection for Sharing, Communicating, and Computing Environments: Taxonomy and Future Directions
这篇论文提出了面向静态数据、在使用中数据和在传输中的数据的数据泄漏防护系统(DLPTS)的整体分类法,分析了最先进的方法,并概述了挑战和未来的研究方向。
The data is an important asset of an organization and it is essential to keep this asset secure. It requires security in whatever state is it i.e. data at rest, data in use, and data in transit. There is a need to pay more attention to it when the third party is included i.e. when the data is stored in the cloud then it requires more security. Since confidential data can reside on a variety of computing devices (physical servers, virtual servers, databases, file servers, PCs, point-of-sale devices, flash drives, and mobile devices) and move through a variety of network access points (wireline, wireless, VPNs, etc.), there is a need of solutions or mechanism that can tackle the problem of data loss, data recovery and data leaks. In this context, the paper presents a holistic view of data protection for sharing and communicating environments for any type of organization. A taxonomy of data leakage protection systems and major challenges faced while protecting confidential data are discussed. Data protection solutions, Data Leakage Protection System's analysis techniques, and, a thorough analysis of existing state-of-the-art contributions empowering machine learning-based approaches are entailed. Finally, the paper explores and concludes various critical emerging challenges and future research directions concerning data protection.
研究动机与目标
- 突出保护机密数据在不同环境中存储、使用和传输的重要性。
- 对数据泄漏防护系统解决方案进行分类并识别其优点和缺点。
- 调研 DLPTS 分析技术和部署方案,以通过跨状态保护数据,包括基于 ML 的方法。
- 识别新兴挑战并提出数据保护方面的未来研究方向。
- 讨论数据泄漏的治理影响及跨行业组织的缓解策略。
提出的方法
- 界定并描述涵盖数据状态、部署模式和补救措施的 Data Leakage Protection Systems (DLPTS) 的分类法。
- 区分数据泄漏防护 (DLP) 与数据泄漏检测 (DLD),并解释它们在各数据状态下的属性。
- 评审并综合 DLPTS 分析技术(基于上下文、基于内容、指纹识别、正则表达式、统计方法、机器学习方法)。
- 分析静态数据、使用中数据和传输中数据的部署考量,包括端点代理和网络设备。
- 就现有方法(策略/访问、虚拟化、密码学、量化、社会/行为分析、数据识别、数据挖掘)进行对比讨论,指出优点与弱点。
实验结果
研究问题
- RQ1在数据静态、数据使用中和数据传输过程中的有效数据保护方面存在哪些挑战?
- RQ2当前 DLPTS 方法的优点和缺点是什么,尚存在哪些差距?
- RQ3新兴技术(例如基于 ML 的分析、指纹、动态分类)如何在保护数据有用性的同时解决数据泄漏问题?
- RQ4哪些未来方向可以降低开销、提升准确性,并实现多目标的保护与检测?
主要发现
- DLPTS 可以在端点和网络之间部署,以在三种状态下保护数据,并为每个状态使用定制化策略。
- 基于内容的 DLPTS(如指纹、正则表达式、机器学习)很常见,但基于正则表达式的方法存在较高的误报,指纹在数据修改下可能失效。
- 一个将数据状态、部署模式、DLPTS 分析技术和补救行动联系起来的分类法有助于组织和比较方法。
- 识别出七个挑战塑造数据保护,包括泄漏通道、人为因素、访问权、加密/隐写、数据修改、可扩展性和数据分类。
- 未来研究方向强调在数据实用性与安全性之间取得平衡、开发动态的多目标 DLPTS、降低开销以及提高检测准确性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。