QUICK REVIEW

[論文レビュー] Change Point Estimation in a Dynamic Stochastic Block Model

Monika Bhattacharjee, Moulinath Banerjee|arXiv (Cornell University)|Dec 7, 2018

Statistical Methods and Inference参考文献 41被引用数 28

ひとこと要約

本稿では、コミュニティ構造が未知の時刻に変化する動的ストークスティックブロックモデル（DSBM）における1つの変化点を推定する2つの手法を提案する。最初の手法は、各時刻で完全なコミュニティ構造推定を伴う最小二乗基準を用いるが、2番目の手法は変化点検出とコミュニティ検出を分離する。両手法とも、異なる識別可能性条件の下で一貫性のある推定を達成し、変化点推定子の理論的収束速度および漸近正規性が確立されている。

ABSTRACT

We consider the problem of estimating the location of a single change point in a dynamic stochastic block model. We propose two methods of estimating the change point, together with the model parameters. The first employs a least squares criterion function and takes into consideration the full structure of the stochastic block model and is evaluated at each point in time. Hence, as an intermediate step, it requires estimating the community structure based on a clustering algorithm at every time point. The second method comprises of the following two steps: in the first one, a least squares function is used and evaluated at each time point, but ignores the community structures and just considers a random graph generating mechanism exhibiting a change point. Once the change point is identified, in the second step, all network data before and after it are used together with a clustering algorithm to obtain the corresponding community structures and subsequently estimate the generating stochastic block model parameters. A comparison between these two methods is illustrated. Further, for both methods under their respective identifiability and certain additional regularity conditions, we establish rates of convergence and derive the asymptotic distributions of the change point estimators. The results are illustrated on synthetic data.

研究の動機と目的

動的ストークスティックブロックモデル（DSBM）に従うネットワーク系列において、コミュニティ構造が未知の時刻に変化する変化点を検出する問題に対処すること。
計算的に効率的で統計的に一貫性のある手法を構築し、変化点および変化前・変化後のコミュニティ構造とSBMパラメータを推定すること。
ネットワークのスパarsityおよびエッジ確率の変化の異なるスケーリング下で、変化点推定子の理論的保証（収束速度および漸近分布）を確立すること。
クラスタリングアルゴリズムの誤分類が、現実的なネットワーク設定における推定の一貫性に与える影響を調査すること。
2つの異なる推定戦略間の計算コストと統計的識別可能性のトレードオフを比較すること。

提案手法

各時刻で完全な確率的ブロックモデル構造を組み込んだ最小二乗基準関数を評価する、完全構造法を提案。これは、各時刻でクラスタリングによるコミュニティ検出を必要とする。
2段階法を導入：まず、コミュニティ構造を無視した最小二乗関数を用いて変化点を検出する。次に、変化点の前後でデータにクラスタリングを適用し、コミュニティ構造とモデルパラメータを推定する。
3つの異なるスケーリング下で、変化点推定子の収束速度および漸近正規性を導出：（1）密なネットワーク、（2）グローバルなエッジ確率変化、（3）局所的なエッジ確率変化。
一貫性のある推定のための識別可能性条件を確立。完全構造法にはクラスタリング誤分類率の条件を、2段階法にはより弱い条件を要求する。
スペクトルクラスタリングを基礎とするコミュニティ検出アルゴリズムを用い、誤分類の影響が変化点推定に与える理論的影響を分析する。
3つのスケーリング下での変化点推定子の漸近分布を分析：（I）密なネットワーク、（II）グローバルなエッジ確率変化、（III）有限個のエッジで確率が異なる局所的変化。

実験結果

リサーチクエスチョン

RQ1コミュニティ構造が1つの未知時刻に変化するDSBMにおいて、どのような条件下で変化点を一貫して推定できるか？
RQ2完全構造最小二乗法と2段階法の間で、計算コストと統計的識別可能性の観点から性能にどのような差があるか？
RQ3異なるネットワークスパarsityスケーリング下で、変化点推定子の収束速度および漸近分布はどのように変化するか？
RQ4クラスタリングアルゴリズムによるノード誤分類は、変化点およびSBMパラメータ推定の一貫性にどのように影響するか？
RQ52段階法は完全構造法よりも弱い識別可能性条件下でも一貫性のある推定を達成できるか？また、どのような現実的ネットワーク状況でその条件が満たされるか？

主な発見

完全構造法は、クラスタリングアルゴリズムの誤分類率に厳しい条件を課すが、一貫性のある推定のためのより強い識別可能性を提供する。
2段階法は、完全構造法よりもはるかに弱い識別可能性条件下でも一貫性のある変化点推定を達成でき、コミュニティの統合・分裂やノード再割り当てといった現実的状況で成立する。
両手法とも、それぞれの正則性および識別可能性条件の下で、変化点推定子は $ O_p(n^{-1}) $ の速度で収束し、3つのスケーリング下すべてで漸近正規性が確立されている。
スケーリングII（グローバルなエッジ変化）では、変化点推定子の漸近分散は、エッジ確率の二乗差の正規化和 $ ilde{ ho}^2 $ に比例する。
スケーリングIII（局所的変化）では、確率が異なる有限集合 $ ilde{ ho}_0 $ のエッジに依存し、極限分布の安定性と収束性を保証する条件が導かれる。
理論的結果は、密なネットワークおよびスパースなネットワークの両方のスケーリングで有効であるが、スパースなスケーリング下での漸近正規性はさらなる検討が必要であり、特に適応的推論の観点から調査が求められる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。