[논문 리뷰] Bayesian Structure Learning with Generative Flow Networks
DAG-GFlowNet은 Generative Flow Networks를 사용하여 Bayesian structure learning에서 DAG의 포스트리에를 근사하고, iid DAG 샘플과 MCMC 및 변분 방법에 비해 시뮬레이션 및 실제 데이터에서 경쟁력 있는 정확성을 제공합니다.
In Bayesian structure learning, we are interested in inferring a distribution over the directed acyclic graph (DAG) structure of Bayesian networks, from data. Defining such a distribution is very challenging, due to the combinatorially large sample space, and approximations based on MCMC are often required. Recently, a novel class of probabilistic models, called Generative Flow Networks (GFlowNets), have been introduced as a general framework for generative modeling of discrete and composite objects, such as graphs. In this work, we propose to use a GFlowNet as an alternative to MCMC for approximating the posterior distribution over the structure of Bayesian networks, given a dataset of observations. Generating a sample DAG from this approximate distribution is viewed as a sequential decision problem, where the graph is constructed one edge at a time, based on learned transition probabilities. Through evaluation on both simulated and real data, we show that our approach, called DAG-GFlowNet, provides an accurate approximation of the posterior over DAGs, and it compares favorably against other methods based on MCMC or variational inference.
연구 동기 및 목표
- 데이터를 주어진 DAG들에 대한 분포를 추론하여 인식 가능한 불확실성(epistemic uncertainty)을 포착하는 Bayesian 구조 학습에 동기를 부여한다.
- GFlowNet 접근법을 제안하여 DAG들에 대한 포스트리에를 근사하고, 구조학성(acyclicity)을 구성에 의해 보장한다.
- flow-matching, detailed-balance 등 개선된 GFlowNet 개념과 그래프에 대한 계층적 순방향 전이 모델을 개발한다.
- 해석 가능성을 보이는 선형-가우시안 네트워크의 시뮬레이션 및 실제 흐름 세포형 데이터에서 DAG-GFlowNet의 효능을 입증한다. interventional 설정 포함
제안 방법
- 포스텝에서 DAG를 상태로 두고 간선을 하나 추가하는 것이 간선-추가에 해당하도록 DAG의 사후분포를 GFlowNet으로 모델링한다.
- 보상 R(G)에 비례하도록 샘플링 확률을 보장하기 위한 flow-matching 또는 detailed-balance 기반 목표를 사용한다.
- 보상 R(G)를 베이지안 점수로 정의한다, R(G)=P(G)P(D|G), 모듈러 사전분포와 주변가능도(Marginal likelihood)를 포함한다.
- forward 전이 Pθ(G'|G)를 계층적 신경망(종료 헤드와 간선 추가 헤드)과 DAG 유효성을 강제하는 마스크로 매개화하고, 확장성을 위한 Linear Transformer 아키텍처를 활용한다.
- 오프-폴리시 학습과 재생 버퍼, 로컬 점수 차이(delta scores), 안정성을 위한 타깃 네트워크를 사용하여 학습한다.
- 샘플링 과정이 DAG 공간에서 샘플을 생성하도록 보장하고, 작업 마스킹과 그래프 구조에 의해 무사건 구성성(acyclicity)을 보장한다.
실험 결과
연구 질문
- RQ1GFlowNet이 데이터 주어졌을 때 DAG들에 대한 포스트리에 분포를 근사할 수 있는가?
- RQ2DAG-GFlowNet이 타깃 포스트리에에서 iid DAG 샘플을 생성하고 구성에 의해 무사건 구성성(acyclicity) 제약을 지키는가?
- RQ3DAG-GFlowNet이 합성 및 실제 데이터에서 MCMC 및 변분 방법에 비해 어떻게 성능을 보이며 interventional 설정을 포함하는가?
- RQ4모듈러 점수(BDe/BGe)가 포스트리에 근사 효율성과 정확도에 어떤 영향을 미치는가?
- RQ5더 큰 그래프에서도 확장 가능하며 실제 DAG의 구조적 특징(간선, 경로, Markov 담요)을 충실히 복원할 수 있는가?
주요 결과
| Method | E-# 간선 | E-SHD | AUROC |
|---|---|---|---|
| MC 3 | 10.96±0.09 | 22.66±0.11 | 0.508 |
| Gadget | 10.59±0.09 | 21.77±0.10 | 0.479 |
| Bootstrap GES | 11.11±0.09 | 23.07±0.11 | 0.548 |
| Bootstrap PC | 7.83±0.04 | 20.65±0.06 | 0.520 |
| DiBS | 12.62±0.16 | 23.32±0.14 | 0.518 |
| BCD Nets | 4.14±0.09 | 18.14±0.09 | 0.510 |
| DAG-GFlowNet | 11.25±0.09 | 22.88±0.10 | 0.541 |
- DAG-GFlowNet은 DAG들에 대한 포스트리에에 대해 정확한 근사를 제공하며, 작은 그래프의 경우 정확한 포스트리에 구조 특성과의 강한 상관관계를 보인다.
- d=20인 선형-가우시안 네트워크에서 DAG-GFlowNet은 E-SHD 및 AUROC에서 MCMC 베이스라인과 경쟁하거나 더 우수하며, 보류된 예측 로그 가능도도 손실하지 않는다.
- 실제 흐름 세포형 데이터(Sachs et al. 2005)에서 DAG-GFlowNet은 MCMC 및 변분 베이스라인에 비해 경쟁력 있는 E-# Edges, E-SHD, AUROC를 달성하며 유리한 트레이드오프를 보인다.
- 메서드는 여러 마르코프 등가 클래스와 DAG를 하나의 그래프로 축약하지 않고 복수의 가능성을 다루어 의미 있는 불확실성 표현을 나타낸다.
- 개입 데이터 사용 시, 프레임워크가 관측 데이터와 개입 증거를 결합하기 위해 BDe 점수를 구조 학습에 맞게 조정할 수 있다.
- 계층적 순방향 모델과 선형 Transformer 백본을 통해 DAG-GFlowNet은 더 큰 그래프에 대한 응용이 가능하도록 확장성을 갖추며 DAG 유효성도 유지한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.