Skip to main content
QUICK REVIEW

[논문 리뷰] If you are not paying for it, you are the product: How much do advertisers pay to reach you?

Panagiotis Papadopoulos, Nicolas Kourtellis|arXiv (Cornell University)|2017. 01. 24.
Privacy, Security, and Data Protection참고 문헌 30인용 수 48
한 줄 요약

이 논문은 브라우저 확장 프로그램을 사용하여 클리어텍스트 및 암호화된 실시간 입찰(RTB) 가격을 모두 모니터링함으로써 프로그램형 온라인 광고에서 광고주가 개별 사용자를 타겟팅하기 위해 지불하는 금액을 실시간으로 추정하는 혁신적인 방법을 제시한다. 프로브 광고 캠프에 기반한 모델을 훈련시켜, 가격이 암호화되어 있어도 사용자 광고 가치 추정 정확도가 82% 이상을 기록하며, 개인 데이터 기반 광고 경제에 있어 사전에 없던 투명성을 제공한다.

ABSTRACT

Online advertising is progressively moving towards a programmatic model in which ads are matched to actual interests of individuals collected as they browse the web. Letting the huge debate around privacy aside, a very important question in this area, for which little is known, is: How much do advertisers pay to reach an individual? In this study, we develop a first of its kind methodology for computing exactly that -- the price paid for a web user by the ad ecosystem -- and we do that in real time. Our approach is based on tapping on the Real Time Bidding (RTB) protocol to collect cleartext and encrypted prices for winning bids paid by advertisers in order to place targeted ads. Our main technical contribution is a method for tallying winning bids even when they are encrypted. We achieve this by training a model using as ground truth prices obtained by running our own "probe" ad-campaigns. We design our methodology through a browser extension and a back-end server that provides it with fresh models for encrypted bids. We validate our methodology using a one year long trace of 1600 mobile users and demonstrate that it can estimate a user's advertising worth with more than 82% accuracy.

연구 동기 및 목표

  • 개인 데이터 기반으로 광고주가 개별 사용자에게 할당하는 재정적 가치에 대한 투명성 부족 문제를 해결하기 위해.
  • RTB 생태계 전반에서 특정 사용자를 타겟팅하기 위해 광고주가 실제로 지불하는 비용을 실시간으로 측정할 수 있는 사용자 중심의 방법을 개발하기 위해.
  • 현대 광고 플랫폼에서 기존 방법이 무력화되는 암호화된 RTB 입찰 가격 측정의 과제를 극복하기 위해.
  • 실제 1,600명의 모바일 사용자에 대한 1년간의 추적 데이터와 두 개의 실제 광고 캠프를 활용하여 방법론을 검증하기 위해.
  • 사용자, 규제 기관, 기업이 개인 데이터의 진정된 경제적 가치를 데이터 기반으로 이해할 수 있도록 지원하기 위해.

제안 방법

  • 이 방법은 광고 입찰 과정에서 실시간으로 클리어텍스트 및 암호화된 RTB 가격 알림을 수동으로 모니터링하는 브라우저 확장 프로그램을 사용한다.
  • 통제된 프로브 광고 캠프를 통해 수집한 기준 가격을 활용해 기계학습 모델을 훈련시으며, 이는 클리어텍스트 및 암호화된 가격을 모두 제공하는 광고 교환소를 대상으로 한다.
  • RTB 입찰 요청 및 응답에서 추출한 특징을 사용해, 가격이 암호화되어 있어도 승리 입찰 가격을 예측하는 데 목적이 있다.
  • 광고 교환소의 행동과 암호화 패턴 변화에 대응하기 위해 백엔드 서버에서 모델을 동적으로 업데이트한다.
  • 실제 1,600명의 모바일 사용자로부터 확보한 12개월간의 실제 사용자 브라우징 데이터 추적을 통해 방법론을 검증한다.
  • 모든 측정된 가격이 최대 인플루언서당 비용(CPM) 모델에 속한다고 가정하므로, 사용자당 최대 가능한 비용을 추정한다.

실험 결과

연구 질문

  • RQ1암호화된 입찰 가격이 존재하는 상황에서, 특히 가격이 암호화되어 있을 때 광고주가 실시간 프로그램형 광고에서 개별 사용자를 타겟팅하기 위해 실제로 얼마나 지불하는가?
  • RQ2광고 요청 및 응답 사이클에서 관찰 가능한 특징만을 사용해, 수동적이고 클라이언트 측 측정 시스템이 암호화된 RTB 입찰 가격을 정확하게 추정할 수 있는가?
  • RQ3클리어텍스트 및 암호화된 입찰 데이터를 병합했을 때 사용자 광고 가치 추정의 정확도는 어떠한가?
  • RQ4암호화된 입찰 데이터를 포함할 경우, 클리어텍스트 데이터에만 의존하는 경우에 비해 사용자 재정적 가치의 총합 추정에 어떤 영향을 미치는가?
  • RQ5사용자 수준의 실시간 시스템이 개인 데이터 기반 광고 경제에 대해 얼마나 높은 수준의 투명성을 제공할 수 있는가?

주요 결과

  • 제안된 방법론은 광고주가 개별 사용자를 타겟팅하기 위해 지불하는 금액을 추정하는 데 82% 이상의 정확도를 달성한다.
  • 암호화된 입찰 데이터를 포함시킬 경우, 클리어텍스트 가격에만 의존하는 방법에 비해 평균 사용자당 수익(ARPU) 추정치가 약 55% 증가한다.
  • 프로브 캠프 데이터를 기반으로 한 모델 훈련을 통해 암호화된 입찰 가격을 성공적으로 식별하고 측정함으로써, 실제 암호화된 광고 환경에서의 실행 가능성은 입증되었다.
  • 12개월간의 검증 기간 동안 1,600명의 실제 사용자 데이터를 기반으로, 다양한 사용자 행동과 광고 교환소 플랫폼 간에도 모델이 강인하고 정확하게 유지됨을 입증했다.
  • 이전 연구에서 암호화된 가격은 측정 불가능하다는 가정을 도전하며, 최소한의 외부 장치만으로도 정확한 추정이 가능하다는 것을 입증했다.
  • 결과적으로, 클리어텍스트 데이터만을 기반으로 한 현재의 ARPU 추정치는 프로그램형 광고에서 사용자 데이터의 진정된 시장 가치를 크게 낮게 평가하고 있음을 시사한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.