Skip to main content
QUICK REVIEW

[论文解读] Dyadic data analysis with amen

Peter D. Hoff|arXiv (Cornell University)|Jun 26, 2015
Statistical Methods and Bayesian Inference参考文献 10被引用 23
一句话总结

本文介绍了 amen R 包,用于使用加法和乘法随机效应模型对二元数据进行建模,通过 MCMC 实现贝叶斯估计,适用于连续、二值、有序、右删失及缺失数据。它展示了潜在因子结构如何捕捉传递性和随机等价性,关键结果表明在贸易和冷战时期冲突/合作数据中存在显著的二元效应。

ABSTRACT

Dyadic data on pairs of objects, such as relational or social network data, often exhibit strong statistical dependencies. Certain types of second-order dependencies, such as degree heterogeneity and reciprocity, can be well-represented with additive random effects models. Higher-order dependencies, such as transitivity and stochastic equivalence, can often be represented with multiplicative effects. The "amen" package for the R statistical computing environment provides estimation and inference for a class of additive and multiplicative random effects models for ordinal, continuous, binary and other types of dyadic data. The package also provides methods for missing, censored and fixed-rank nomination data, as well as longitudinal dyadic data. This tutorial illustrates the "amen" package via example statistical analyses of several of these different data types.

研究动机与目标

  • 开发一个灵活的统计框架,用于分析具有复杂依赖关系(如互惠性、传递性和度异质性)的二元数据。
  • 通过引入建模发送方和接收方节点异质性的随机效应,克服经典方差分析在二元数据中的局限性。
  • 将建模能力扩展至非高斯结果,包括二值、有序、右删失及固定名次提名数据。
  • 通过 amen R 包提供统一的计算工具,支持多种二元数据类型的估计、推断和诊断。
  • 利用低秩潜在因子模型分析对称和纵向二元数据,以捕捉如随机等价性等高阶依赖关系。

提出的方法

  • 使用加法随机效应模型(AME)表示社会矩阵数据中的行与列异质性,公式为 $ y_{i,j} = \mu + a_i + b_j + \epsilon_{i,j} $。
  • 通过低秩分解 $ \mathbf{M} = \mathbf{U}\boldsymbol{\Lambda}\mathbf{U}^T $ 应用乘法潜在因子模型,以建模传递性和随机等价性。
  • 采用贝叶斯层次模型结合 MCMC 抽样进行后验推断,包括吉布斯抽样和梅特罗波利斯-哈斯廷斯更新。
  • 支持多种结果类型:高斯分布、二值、有序、右删失及固定名次提名数据,使用相应的似然函数和链接函数。
  • 通过线性预测器中的回归分量整合节点属性和二元协变量,实现对可观测属性的调整。
  • 在 `ame` 函数中使用 `symmetric=TRUE` 实现对称建模,以处理对称的二元关系,确保行与列效应的一致性。

实验结果

研究问题

  • RQ1加法和乘法随机效应模型在多大程度上能有效捕捉二元数据中的二阶及更高阶依赖关系?
  • RQ2节点属性(如国内生产总值、政体)在多大程度上能解释国际贸易或冲突等二元结果的变化?
  • RQ3低秩潜在因子模型在多大程度上能有效表示关系数据中的传递性和随机等价性?
  • RQ4数据结构(如缺失值、右删失观测或自我中心抽样)对模型估计和推断有何影响?
  • RQ5对称二元模型能否有效区分国际关系数据中合作与冲突的模式?

主要发现

  • 社会关系模型揭示了在国际贸易中出口方和进口方行为存在显著异质性,美国和日本在出口和进口效应方面均最高。
  • 在冷战数据中,二元协变量 'ldist'(对数距离)与合作呈强正相关(系数 0.365,p < 0.001),表明地理距离与冲突减少相关。
  • 二元协变量 'ipol'(政体互动)表现出显著正向效应(系数 0.133,p = 0.027),表明政治体制的同质性有助于增强合作。
  • 潜在因子项的估计特征值为 63.61,表明网络中存在强烈的潜在结构,合作配对的潜在因子得分相似,而冲突配对的得分符号相反。
  • 诊断图显示在经过长时间的预烧和抽样(100,000 次迭代)后,MCMC 混合良好,验证了对称有序模型后验估计的有效性。
  • 该模型成功捕捉了非对称模式:具有相似潜在因子得分的国家更可能合作,而具有相反得分的国家更可能冲突。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。