QUICK REVIEW

[논문 리뷰] You are who you know and how you behave: attribute inference attacks via users' social friends and behaviors

Neil Zhenqiang Gong, Bin Liu|arXiv (Cornell University)|2016. 08. 10.

Privacy-Preserving Technologies in Data참고 문헌 43인용 수 56

한 줄 요약

이 논문은 사용자의 사회적 친구 관계와 행동 기록(예: 좋아요 누른 페이지 또는 앱)을 결합하여 사생활 정보인 거주지, 직업, 관심사 등을 추론하는 새로운 속성 유추 공격을 제안한다. 통합된 모델을 통해 사회적 및 행동적 데이터를 융합함으로써, 110만 명의 사용자로 구성된 실세계 데이터셋에서 사용자의 도시를 유추하는 데 57%의 성공률을 기록하며, 가장 확신도가 높은 절반의 사용자에게만 집중할 경우 성공률이 90% 이상으로 상승한다.

ABSTRACT

We propose new privacy attacks to infer attributes (e.g., locations, occupations, and interests) of online social network users. Our attacks leverage seemingly innocent user information that is publicly available in online social networks to infer missing attributes of targeted users. Given the increasing availability of (seemingly innocent) user information online, our results have serious implications for Internet privacy - private attributes can be inferred from users' publicly available data unless we take steps to protect users from such inference attacks. To infer attributes of a targeted user, existing inference attacks leverage either the user's publicly available social friends or the user's behavioral records (e.g., the webpages that the user has liked on Facebook, the apps that the user has reviewed on Google Play), but not both. As we will show, such inference attacks achieve limited success rates. However, the problem becomes qualitatively different if we consider both social friends and behavioral records. To address this challenge, we develop a novel model to integrate social friends and behavioral records and design new attacks based on our model. We theoretically and experimentally demonstrate the effectiveness of our attacks. For instance, we observe that, in a real-world large-scale dataset with 1.1 million users, our attack can correctly infer the cities a user lived in for 57% of the users; via confidence estimation, we are able to increase the attack success rate to over 90% if the attacker selectively attacks a half of the users. Moreover, we show that our attack can correctly infer attributes for significantly more users than previous attacks.

연구 동기 및 목표

기존의 속성 유추 공격가 사회적 친구 관계 또는 행동 데이터 중 하나에만 의존하는 한계를 해결하기 위해.
사회 네트워크 구조와 사용자 행동을 융합할 경우 속성 유추 정확도가 향상되는지 조사하기 위해.
사회적 및 행동적 데이터를 효과적으로 통합하여 더 효과적인 유추 공격을 위한 통합 모델을 설계하기 위해.
대규모 소셜 네트워크 데이터에서 이러한 통합 공격의 실세계 적용 가능성과 성공률을 평가하기 위해.

제안 방법

사용자의 사회적 친구 관계와 행동 기록(예: 좋아요 누른 페이지, 앱 등)을 함께 인코딩하여 통합된 표현으로 변환하는 새로운 머신러닝 모델을 개발한다.
통합된 표현을 사용하여 대상 사용자의 사생활 정보(예: 거주지, 직업, 관심사 등)를 예측한다.
신뢰도 추정 기법을 적용하여 예측 정확도가 높은 사용자를 식별하고 우선순위를 정해 선택적 공격을 수행한다.
110만 명의 사용자로 구성된 대규모 실세계 데이터셋을 활용하여 공격 모델을 훈련하고 평가한다.
기존의 사회적 또는 행동적 데이터만을 사용하는 방법과 비교하여 제안된 통합 모델의 성능을 평가한다.
정확도 및 AUC와 같은 표준 평가 지표를 사용하여 공격 성공률을 측정한다.

실험 결과

연구 질문

RQ1사회적 친구 관계와 행동 데이터를 융합할 경우, 단독으로 하나의 데이터 유형을 사용하는 것보다 속성 유추 공격의 성공률을 크게 향상시킬 수 있는가?
RQ2제안된 모델은 거주지, 직업, 관심사와 같은 사생활 정보를 얼마나 효과적으로 유추할 수 있는가?
RQ3신뢰도 추정을 통해 가장 예측 가능성이 높은 사용자에게 집중할 경우, 공격 성능을 얼마나 향상시킬 수 있는가?
RQ4실세계 대규모 소셜 네트워크 데이터에서 제안된 공격의 정확도와 커버리지 측면에서 스케일링 능력은 어떠한가?

주요 결과

제안된 공격는 실세계 110만 명의 사용자 데이터셋에서 사용자의 거주지를 올바르게 유추하는 데 57%의 성공률을 기록한다.
신뢰도 추정을 활용해 예측 정확도가 높은 사용자에게만 집중할 경우, 절반의 사용자에 대해 성공률이 90% 이상으로 상승한다.
이전의 사회적 친구 관계나 행동 기록 중 하나에만 의존하는 방법보다 공격 성능이 뚜렷이 뛰어나, 훨씬 더 많은 사용자에게 속성 정보를 유추할 수 있다.
사회적 및 행동적 데이터의 융합은 추론 성능 향상에 질적 영향을 미치며, 개인정보 공격에서 다중 모odal 데이터의 가치를 입증한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.