Skip to main content
QUICK REVIEW

[论文解读] On the Concept of Snowball Sampling

Mark S. Handcock, Krista J. Gile|arXiv (Cornell University)|Aug 1, 2011
HIV, Drug Use, Sexual Risk参考文献 7被引用 78
一句话总结

本文澄清了社会科学与统计学中关于'snowball sampling'定义的冲突,区分了概率性链路追踪方法(如Goodman的k阶段抽样)与针对难以接触人群的非概率性便利抽样。文章主张采用更精确的术语'link-tracing sampling'以解决术语混淆问题,尤其是在现代方法如受访者驱动抽样(RDS)中。

ABSTRACT

This brief comment reflects on the historical and current uses of the term "snowball sampling."

研究动机与目标

  • 解决社会科学与统计学中长期存在的'snowball sampling'术语混淆问题。
  • 阐明'snowball sampling'有两种截然不同的用法:一种是用于估计关系网络特征的概率性方法,另一种是针对难以接触人群的非概率性便利抽样方法。
  • 强调这两种用法之间的张力日益加剧,尤其是在受访者驱动抽样(RDS)的语境下。
  • 倡导采用更精确的术语'link-tracing sampling',以提升研究中的方法论清晰度。
  • 支持在非概率抽样设计的RDS数据基础上,发展统计上严谨的估计量。

提出的方法

  • 系统回顾1940年代至现代RDS中'snowball sampling'的历史与当代用法。
  • 比较概率性公式(如Goodman的k阶段抽样)与非概率性便利抽样方法。
  • 分析RDS估计量的统计特性,包括对种子选择与同质性(homophily)的偏差校正。
  • 使用'link-tracing sampling'一词涵盖历史与现代应用,取代'snowball sampling'的模糊用法。
  • 评估Gile(2008, 2011)与Gile & Handcock(2010, 2011)提出的估计量,以校正RDS中的抽样偏差。
  • 强调在研究中明确定义术语,以防止误解,尤其是在跨学科语境中。

实验结果

研究问题

  • RQ1为何'snowball sampling'这一术语在社会科学与统计学中引发了广泛混淆?
  • RQ2概率性与非概率性应用'snowball sampling'之间的关键差异是什么?
  • RQ3现代方法如受访者驱动抽样(RDS)如何与'snowball sampling'的两种不同传统相关联?
  • RQ4非概率性链路追踪方法在多大程度上可以近似概率抽样,特别是在难以接触的人群中?
  • RQ5为减少基于RDS数据的估计量中的偏差,需要哪些统计校正?

主要发现

  • 术语'snowball sampling'在不同学科中使用不一致,主要有两种含义:一是用于估计网络结构特征的概率性方法,二是针对难以接触人群的非概率性便利抽样。
  • Goodman(1961)的k阶段雪球抽样是一种严谨的概率性方法,用于估计互惠关系、三角关系等关系特征。
  • Trow(1957)的方法虽不具备代表性,但为难以接触人群的网络抽样奠定了基础。
  • 受访者驱动抽样(RDS)体现了非概率抽样与估计总体参数目标之间的张力。
  • RDS数据的估计量需要对有放回抽样假设与非随机种子选择进行偏差校正,尤其在同质性(homophily)存在时更为重要。
  • 作者建议用'link-tracing sampling'替代'snowball sampling',以增强方法论清晰度,减少研究中的模糊性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。