[论文解读] If you are not paying for it, you are the product: How much do advertisers pay to reach you?
本文提出了一种新颖的实时方法,用于估算广告商在程序化在线广告中为触达单个用户所支付的费用,通过浏览器扩展监控明文和加密的实时出价(RTB)价格。通过在探测广告活动上训练模型,即使在价格加密的情况下,该方法在估算用户广告价值方面也达到了超过82%的准确率,为基于个人数据的广告经济提供了前所未有的透明度。
Online advertising is progressively moving towards a programmatic model in which ads are matched to actual interests of individuals collected as they browse the web. Letting the huge debate around privacy aside, a very important question in this area, for which little is known, is: How much do advertisers pay to reach an individual? In this study, we develop a first of its kind methodology for computing exactly that -- the price paid for a web user by the ad ecosystem -- and we do that in real time. Our approach is based on tapping on the Real Time Bidding (RTB) protocol to collect cleartext and encrypted prices for winning bids paid by advertisers in order to place targeted ads. Our main technical contribution is a method for tallying winning bids even when they are encrypted. We achieve this by training a model using as ground truth prices obtained by running our own "probe" ad-campaigns. We design our methodology through a browser extension and a back-end server that provides it with fresh models for encrypted bids. We validate our methodology using a one year long trace of 1600 mobile users and demonstrate that it can estimate a user's advertising worth with more than 82% accuracy.
研究动机与目标
- 为解决数字广告定价中缺乏透明度的问题,特别是广告商基于个人数据为单个用户分配的财务价值。
- 开发一种实时、以用户为中心的方法,用于估算广告商在RTB生态系统中针对特定用户的目标投放实际成本。
- 克服测量加密RTB出价价格的挑战,因为这使得现有方法在现代广告平台中失效。
- 通过为期一年的1,600名真实移动用户的追踪以及两个真实广告活动来验证该方法。
- 为用户提供、监管机构和企业赋能,提供关于个人数据在在线广告中真实经济价值的数据驱动洞察。
提出的方法
- 该方法使用浏览器扩展被动监控广告拍卖期间的RTB价格通知——包括明文和加密形式——实现实时监控。
- 利用从针对同时提供明文和加密价格的广告交易所投放的受控探测广告活动收集的真实价格数据,训练机器学习模型。
- 该模型利用从RTB出价请求和响应中提取的特征,预测中标的出价价格,即使价格被加密也能实现。
- 系统在后端服务器上动态更新模型,以适应广告交易所行为和加密模式的变化。
- 该方法通过1,600名真实移动用户的12个月真实用户浏览数据追踪进行验证。
- 该方法假设所有测量价格均采用每次千次展示(CPM)模型,因此估算每位用户的最高可能成本。
实验结果
研究问题
- RQ1在实时程序化广告中,广告商实际为触达单个用户支付多少费用,尤其是在出价价格被加密的情况下?
- RQ2是否可以使用广告请求和响应周期中可观测的特征,通过被动的、客户端侧的测量系统准确估算加密的RTB出价价格?
- RQ3在结合明文和加密出价数据的情况下,估算用户广告价值的准确度如何?
- RQ4与仅依赖明文数据相比,包含加密出价数据如何影响对用户整体财务价值的估算?
- RQ5用户级别的实时系统在多大程度上能够实现对基于个人数据的广告经济的透明化?
主要发现
- 所提出的方法在确定广告商为触达单个用户所支付的费用方面,实现了超过82%的估算准确率。
- 与仅依赖明文价格的方法相比,包含加密出价数据可使每位用户的平均收入(ARPU)估算值提高约55%。
- 该系统通过在探测活动数据上训练模型,成功识别并测量了加密出价价格,证明了在真实世界加密广告环境中实现可行性的能力。
- 该模型在12个月的验证期内,对多样化用户行为和广告交易所平台均保持稳健和准确,覆盖1,600名真实用户。
- 本研究挑战了先前研究中认为加密价格不可测量的假设,证明在极少外部设备干预的情况下,仍可实现准确估算。
- 结果表明,基于仅明文数据的当前ARPU估算值显著低估了程序化广告中用户数据的真实市场价值。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。