[論文レビュー] Bayesian Structure Learning with Generative Flow Networks
DAG-GFlowNet は Generative Flow Networks を用いてベイズ構造学習の後方分布を近似し、DAG の独立同分布サンプルを提供するとともに、シミュレーションデータおよび実データで MCMC や変分法と競合する精度を示す。
In Bayesian structure learning, we are interested in inferring a distribution over the directed acyclic graph (DAG) structure of Bayesian networks, from data. Defining such a distribution is very challenging, due to the combinatorially large sample space, and approximations based on MCMC are often required. Recently, a novel class of probabilistic models, called Generative Flow Networks (GFlowNets), have been introduced as a general framework for generative modeling of discrete and composite objects, such as graphs. In this work, we propose to use a GFlowNet as an alternative to MCMC for approximating the posterior distribution over the structure of Bayesian networks, given a dataset of observations. Generating a sample DAG from this approximate distribution is viewed as a sequential decision problem, where the graph is constructed one edge at a time, based on learned transition probabilities. Through evaluation on both simulated and real data, we show that our approach, called DAG-GFlowNet, provides an accurate approximation of the posterior over DAGs, and it compares favorably against other methods based on MCMC or variational inference.
研究の動機と目的
- データからの情報を用いて DAG の分布を推定し、 epistemic 不確実性を捉えることでベイズ的な構造学習を動機づける。
- 後方分布 over DAGs を近似する Generative Flow Network (GFlowNet) アプローチを提案し、構築的に非循環性を担保する。
- グローバルな forward-transition モデルを用いた階層的な GFlowNet の概念(flow-matching、detailed-balance)とグラフ向けの階層的 forward-transition モデルを開発する。
- シミュレーションされた線形ガウスネットワークおよび実データのフローサイトメトリーデータを含む介入設定を含め、DAG-GFlowNet の有効性を実証する。
提案手法
- DAG の後方分布を DAG が状態、辺が単一の辺を追加することに対応するような GFlowNet としてモデル化する。
- 報酬 R(G) に比例したサンプリング確率を確保するため、flow-matching または detailed-balance ベースの目的を用いる。
- 報酬 R(G) をベイズスコアとして定義し、R(G)=P(G)P(D|G)(モジュラー事前分布と周辺尤度を用いる)とする。
- 前方遷移 Pθ(G'|G) を階層的ニューラルネットワーク( termination head と edge-addition head)と DAG の妥当性を強制するマスクでパラメータ化し、スケーラビリティのために Linear Transformer アーキテクチャを採用する。
- リプレイバッファ、局所スコア差分 delta-scores、安定性のためのターゲットネットワークを用いたオフポリシー学習で訓練する。
- アクションマスキングとグラフ構造により、DAG 空間からのサンプリングが循環性なしで得られることを保証する。
実験結果
リサーチクエスチョン
- RQ1データを与えられたとき Generative Flow Network は DAGs の後方分布を近似できるのか。
- RQ2DAG-GFlowNet はターゲット後方から iid の DAG サンプルを生み出し、構築的に非循環性制約を満たすのか。
- RQ3DAG-GFlowNet は synthetic および real data の両方で MCMC および変分法と比較してどのような性能を示すのか(介入設定を含む)?
- RQ4モジュラー・スコア(BDe/BGe)が後方推定の効率と精度に与える影響はどの程度か。
- RQ5方法はより大きなグラフへスケールし、真の DAG の構造特徴(エッジ、経路、マルコフブランケット)を忠実に回復できるのか。
主な発見
| Method | E-# Edges | E-SHD | AUROC |
|---|---|---|---|
| MC 3 | 10.96±0.09 | 22.66±0.11 | 0.508 |
| Gadget | 10.59±0.09 | 21.77±0.10 | 0.479 |
| Bootstrap GES | 11.11±0.09 | 23.07±0.11 | 0.548 |
| Bootstrap PC | 7.83±0.04 | 20.65±0.06 | 0.520 |
| DiBS | 12.62±0.16 | 23.32±0.14 | 0.518 |
| BCD Nets | 4.14±0.09 | 18.14±0.09 | 0.510 |
| DAG-GFlowNet | 11.25±0.09 | 22.88±0.10 | 0.541 |
- DAG-GFlowNet は DAG の後方分布の正確な近似を提供し、比較的小さなグラフでは正確な後方構造特徴と強い相関を示す。
- d=20 の線形ガウスネットワークのシミュレーションでは、DAG-GFlowNet は E-SHD および AUROC で MCMC ベースラインと競合するかそれより優れており、保持データの予測対数尤度を損なわない。
- 実データのフローサイトメトリー(Sachs ら 2005)では、DAG-GFlowNet は MCMC および変分法ベースラインと比較して E-# Edges、E-SHD、AUROC の点で競争力があり、トレードオフが有利であることを示す。
- この手法は単一のグラフに収束せず、複数のマルコフ同値類と DAG をカバーしており、意味のある不確実性の表現を示す。
- 介入データを用いることで、構造学習のための BDe スコアを観測データと介入証拠を組み合わせる形に適用できる。
- 階層的 forward モデルと linear Transformer ベースのバックボーンにより、DAG-GFlowNet はより大規模なグラフへスケールしつつ DAG の妥当性を保つことが可能である。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。