QUICK REVIEW

[논문 리뷰] Marginal Likelihoods from Monte Carlo Markov Chains

Alan Heavens, Y. Fantaye|arXiv (Cornell University)|2017. 04. 11.

Insurance, Mortality, Demography, Risk Management참고 문헌 1인용 수 29

한 줄 요약

이 논문은 MCMC 샘플들로부터 주변 우도(베이지안 증거)를 추정하기 위해 마할라노비스 거리와 k번째 최근접 이웃 거리를 사용하는 베이지안 최근접이웃 방법을 제안한다. 20차원에서 약 2배의 정확도를 달성하며, k=1이 최적임을 확인하고 사전 whitening이 성능을 향상시킴으로써 고차원 매개변수 공간에서의 안정적인 모델 비교가 가능해진다.

ABSTRACT

In this paper, we present a method for computing the marginal likelihood, also known as the model likelihood or Bayesian evidence, from Markov Chain Monte Carlo (MCMC), or other sampled posterior distributions. In order to do this, one needs to be able to estimate the density of points in parameter space, and this can be challenging in high numbers of dimensions. Here we present a Bayesian analysis, where we obtain the posterior for the marginal likelihood, using $k$th nearest-neighbour distances in parameter space, using the Mahalanobis distance metric, under the assumption that the points in the chain (thinned if required) are independent. We generalise the algorithm to apply to importance-sampled chains, where each point is assigned a weight. We illustrate this with an idealised posterior of known form with an analytic marginal likelihood, and show that for chains of length $\sim 10^5$ points, the technique is effective for parameter spaces with up to $\sim 20$ dimensions. We also argue that $k=1$ is the optimal choice, and discuss failure modes for the algorithm. In a companion paper (Heavens et al. 2017) we apply the technique to the main MCMC chains from the 2015 Planck analysis of cosmic background radiation data, to infer that quantitatively the simplest 6-parameter flat $Λ$CDM standard model of cosmology is preferred over all extensions considered.

연구 동기 및 목표

MCMC 샘플들로부터 주변 우도를 계산하는 방법을 개발함으로써 베이지안 모델 비교에 필수적인 요소를 확보한다.
MCMC 샘플들로부터 고차원 밀도를 추정하는 데 있어 차원의 저주로 인해 표준 밀도 추정이 어려운 문제를 해결한다.
비독립 동일분포가 아닌 사후 샘플들인 중요도 샘플링 체인으로도 일반화된 방법을 제안함으로써 적용 범위를 넓힌다.
특히 고차원 매개변수 공간에서의 성능과 강인성을 다양한 차원과 샘플 크기에서 평가한다.
정확도와 분산을 감소시키는 데 기여하는 최적의 k 값과 변환 전략(예: 사전 whitening)을 규명한다.

제안 방법

매개변수 공간에서 k번째 최근접이웃 거리를 사용하여 MCMC 샘플들의 국소 밀도를 추정하며, 밀도가 이웃들이 형성하는 부피의 역수에 비례한다는 사실을 활용한다.
고차원 매개변수 공간에서 상관관계와 척도를 고려하기 위해 마할라노비스 거리 척도를 적용하여 유클리드 거리보다 정확도를 향상시킨다.
모든 MCMC 점들로부터의 우도를 결합하는 베이지안 프레임워크를 사용하여 주변 우도에 대한 사후분포를 형성한다.
중요도 샘플링 체인으로 일반화하기 위해 최근접이웃 밀도 추정에 가중치를 통합한다.
체인의 공분산 행렬을 사용하여 매개변수를 상관관계가 없고 분산이 1인 성분으로 변환함으로써 사전 whitening을 수행하며, 변환된 공간에서 유클리드 거리를 사용할 수 있도록 한다.
변환의 자코비안을 사용하여 사전 whitened 공간에서 주변 우도를 정확히 계산한다.

실험 결과

연구 질문

RQ1표준 MCMC 체인을 사용하여 최근접이웃 밀도 추정을 통해 주변 우도를 정확하게 추정할 수 있는가?
RQ2최근접이웃 수 k의 선택이 주변 우도 추정의 정확도와 분산에 어떤 영향을 미치는가?
RQ3마할라노비스 거리 또는 사전 whitening을 사용할 경우 고차원 매개변수 공간에서 성능이著명하게 향상되는가?
RQ4이 방법의 실패 모드는 무엇이며, 어떤 조건에서 성능이 떨어지는가?
RQ5이 방법은 중요도 샘플링 체인으로 일반화될 수 있으며, 비i.i.d. 샘플링 조건에서 어떻게 성능을 발휘하는가?

주요 결과

체인 길이가 약 10⁵인 20차원 매개변수 공간에서 약 2배의 정확도를 달성하며, 오차는 두 배 이내로 유지된다.
k=1이 최적임이 확인되었으며, 높은 k 값은 편향을 증가시켜 정확도를 떨어뜨리지만 분산은 낮춘다.
마할라노비스 거리 또는 사전 whitening을 사용할 경우, 단순한 유클리드 거리보다 고차원에서 성능이著명하게 향상된다.
대상 분포가 일반적인 최근접이웃 거리 범위에서 일정하게 근사되지 않을 경우, 특히 (αₘN/V)^(-1/m) > 0.5일 경우에 실패한다.
사전 whitening은 노이즈를 감소시키고 정확도를 향상시키며, k=1은 k=4보다 더 높은 정확도를 보이지만 더 노이즈가 많다.
알고리즘은 독립 샘플을 가정하므로, 자동상관이 존재할 경우 체인 희석을 권장한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.