QUICK REVIEW

[论文解读] LSTM-TrajGAN: A Deep Learning Approach to Trajectory Privacy Protection

Jinmeng Rao, Song Gao|arXiv (Cornell University)|Jun 14, 2020

Human Mobility and Location-Based Analysis参考文献 27被引用 36

一句话总结

引入 LSTM-TrajGAN，一种端到端的深度学习模型，生成保护隐私的合成轨迹，以在保护用户隐私的同时保留分析实用性。

ABSTRACT

The prevalence of location-based services contributes to the explosive growth of individual-level trajectory data and raises public concerns about privacy issues. In this research, we propose a novel LSTM-TrajGAN approach, which is an end-to-end deep learning model to generate privacy-preserving synthetic trajectory data for data sharing and publication. We design a loss metric function TrajLoss to measure the trajectory similarity losses for model training and optimization. The model is evaluated on the trajectory-user-linking task on a real-world semantic trajectory dataset. Compared with other common geomasking methods, our model can better prevent users from being re-identified, and it also preserves essential spatial, temporal, and thematic characteristics of the real trajectory data. The model better balances the effectiveness of trajectory privacy protection and the utility for spatial and temporal analyses, which offers new insights into the GeoAI-powered privacy protection.

研究动机与目标

在位置服务中阐明轨迹隐私保护的动机以及保持分析实用性的需求。
提出一个端到端的深度学习框架以生成隐私保护的合成轨迹。
开发 TrajLoss 指标，以联合优化隐私保护和轨迹实用性。
在轨迹-用户关联任务中评估隐私保护，并通过时空分析评估合成轨迹的实用性。

提出的方法

用数据集质心的空间偏差和逐时/类别特征的独热向量对轨迹进行编码。
使用一个三组件的 LSTM-TrajGAN：轨迹编码/嵌入、将嵌入特征与噪声融合的生成器，以及用于区分真实与合成轨迹的判别器。
用 TrajLoss 进行训练，它是一个综合损失，包括来自判别器的 BCE 以及空间、时间和类别相似性损失。
通过密集层解码合成轨迹为纬度/经度偏差以及逐时/类别属性的独热编码。
在轨迹-用户关联任务中与 Random Perturbation 和 Gaussian geomasking 进行比较，并分析时空实用性。

实验结果

研究问题

RQ1RQ1: LSTM-TrajGAN 在保护轨迹创建者在 TUL 任务中的重新识别方面有多有效？
RQ2RQ2: 与真实轨迹相比，合成轨迹是否保留了关键的空间、时间和主题特征？

主要发现

方法	ACC@1	ACC@5	Macro-F1	Macro-P	Macro-R
原始	0.938	0.976	0.925	0.937	0.927
RP（仅空间）	0.777	0.934	0.758	0.806	0.764
RP（时空）	0.668	0.888	0.640	0.711	0.654
高斯（仅空间）	0.561	0.832	0.522	0.573	0.537
高斯（时空）	0.486	0.766	0.431	0.488	0.470
LSTM-TrajGAN	0.459	0.722	0.381	0.429	0.428

合成轨迹显著降低 TUL 的准确度，将 ACC@1 从 0.938 降至 0.459，ACC@5 从 0.976 降至 0.722，显示出强隐私保护效果。
LSTM-TrajGAN 在平衡隐私与实用性方面优于基线的几何掩码方法，同时相比随机扰动和高斯方法在降低 TUL 指标方面表现得更显著。
合成轨迹的空间与时间特征保留得相对良好，时间/类别分布与原始轨迹高度接近（分析中报告的皮尔逊相关）。
基于 Hausdorff 和 Jaccard 的空间分析显示 LSTM-TrajGAN 比高斯几何掩码在空间相似性方面更好，同时提供更强的隐私保护。
模型敏感性分析表明学习率和嵌入维度显著影响隐私-实用性权衡。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。