Skip to main content
QUICK REVIEW

[論文レビュー] Dyadic data analysis with amen

Peter D. Hoff|arXiv (Cornell University)|Jun 26, 2015
Statistical Methods and Bayesian Inference参考文献 10被引用数 23
ひとこと要約

本稿では、連続的、バイナリー、順序的、右打ち切り、欠損値を含むデータに対してMCMCを用いたベイズ推定を可能にする、加法的および乗法的ランダム効果モデルを用いた対象データ(dyadic data)をモデリングするためのamen Rパッケージを紹介する。潜在的要因構造が推移性と確率的同等性を捉える仕組みを示し、主な結果として、貿易および冷戦期の対立・協力データにおいて顕著な対象効果が確認された。

ABSTRACT

Dyadic data on pairs of objects, such as relational or social network data, often exhibit strong statistical dependencies. Certain types of second-order dependencies, such as degree heterogeneity and reciprocity, can be well-represented with additive random effects models. Higher-order dependencies, such as transitivity and stochastic equivalence, can often be represented with multiplicative effects. The "amen" package for the R statistical computing environment provides estimation and inference for a class of additive and multiplicative random effects models for ordinal, continuous, binary and other types of dyadic data. The package also provides methods for missing, censored and fixed-rank nomination data, as well as longitudinal dyadic data. This tutorial illustrates the "amen" package via example statistical analyses of several of these different data types.

研究の動機と目的

  • 相互作用の複雑な依存関係(相互性、推移性、次数の不均一性など)を扱う柔軟な統計的フレームワークの開発。
  • 古典的ANOVAの対象データへの適用限界を克服し、送信者および受信者役割におけるノードの不均一性をモデル化するランダム効果を組み込む。
  • 正規分布でない結果(バイナリー、順序的、右打ち切り、固定順位ノーテーションデータなど)に対してもモデル化能力を拡張。
  • 多様な対象データタイプの推定、仮説検定、診断をサポートする統合的計算ツールとしてのamen Rパッケージの提供。
  • 低ランク潜在的要因モデルを用いて、対称的および縦断的対象データを分析し、確率的同等性のような高次元の依存関係を捉えることの有効性の検証。

提案手法

  • 社会行列データにおける行と列の不均一性を表すために、加法的ランダム効果モデル(AME)を用い、$ y_{i,j} = \mu + a_i + b_j + \epsilon_{i,j} $ と定式化。
  • 低ランク分解 $ \mathbf{M} = \mathbf{U}\boldsymbol{\Lambda}\mathbf{U}^T $ を用いた乗法的潜在的要因モデルを適用し、推移性と確率的同等性をモデル化。
  • ベイズ階層モデルを用い、Gibbsサンプリングおよびメトロポリス・ハスティングス更新を含むMCMCサンプリングによる後erior推定を実施。
  • ガウス分布、バイナリー、順序的、右打ち切り、固定順位ノーテーションデータなど、複数の結果タイプをサポート。それぞれに適切な尤度関数とリンク関数を適用。
  • 線形予測子にノードおよび対象の共変量を回帰成分として組み込み、観察された属性の調整を可能に。
  • `ame`関数における `symmetric=TRUE` を用いた対称的モデリングにより、対称的な対象関係を処理し、一貫性のある行と列の効果を保証。

実験結果

リサーチクエスチョン

  • RQ1加法的および乗法的ランダム効果モデルは、対象データにおける2次以降の依存関係をどの程度効果的に捉えることができるか?
  • RQ2ノード属性(例:GDP、政治的安定性)は、国際貿易や対立といった対象結果の変動をどの程度説明できるか?
  • RQ3低ランク潜在的要因モデルは、関係データにおける推移性と確率的同等性をどの程度適切に表現できるか?
  • RQ4欠損値、右打ち切り観測、エゴセントリックサンプリングなどのデータ構造が、モデル推定および仮説検定に与える影響は何か?
  • RQ5対称的対象モデルは、国際関係データにおける協力と対立のパターンを効果的に区別できるか?

主な発見

  • 社会関係モデルにより、国際貿易における輸出者および輸入者行動の顕著な不均一性が明らかになった。特に米国と日本が、最も高い輸出および輸入効果を示した。
  • 冷戦期データでは、対象共変量 'ldist'(対数距離)が協力と強く正の相関を示した(回帰係数 0.365、p < 0.001)。これは地理的距離が対立を減少させることを示唆している。
  • 対象共変量 'ipol'(政治的相互作用)は有意な正の効果を示した(回帰係数 0.133、p = 0.027)。これは政治的システムの類似性(同質性)が協力を促進することを示している。
  • 潜在的要因項の推定固有値は63.61であり、ネットワークに強い潜在的構造が存在することを示しており、協力的ペアは類似した潜在的要因スコアを、対立的ペアは逆符号のスコアを示していた。
  • 診断プロットにより、100,000イタレーションの十分なバーニングアップとサンプリング後、MCMCの混合状態が良好であることが確認され、対称的順序データモデルの後erior推定が妥当であることが裏付けられた。
  • モデルは非対称パターンを効果的に捉えていた。潜在的要因スコアが類似する国々は協力を、逆符号のスコアを示す国々は対立を示す傾向が強かった。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。