QUICK REVIEW

[논문 리뷰] Shapley effects for sensitivity analysis with correlated inputs: comparisons with Sobol' indices, numerical estimation and applications

Bertrand Iooss, Clémentine Prieur|arXiv (Cornell University)|2017. 07. 05.

Probabilistic and Robust Engineering Design참고 문헌 44인용 수 108

한 줄 요약

이 논문은 상관된 입력에 대한 글로벌 민감도 분석을 위한 Shapley 효과를 분석하고, 이를 Sobol’ 지수와 비교하며, 가우시안-선형 설정에서 해석적 결과를 도출하고, 모형 기반 추정을 통해 시연합니다.

ABSTRACT

The global sensitivity analysis of a numerical model aims to quantify, by means of sensitivity indices estimate, the contributions of each uncertain input variable to the model output uncertainty. The so-called Sobol' indices, which are based on the functional variance analysis, present a difficult interpretation in the presence of statistical dependence between inputs. The Shapley effect was recently introduced to overcome this problem as they allocate the mutual contribution (due to correlation and interaction) of a group of inputs to each individual input within the group.In this paper, using several new analytical results, we study the effects of linear correlation between some Gaussian input variables on Shapley effects, and compare these effects to classical first-order and total Sobol' indices.This illustrates the interest, in terms of sensitivity analysis setting and interpretation, of the Shapley effects in the case of dependent inputs. For the practical issue of computationally demanding computer models, we show that the substitution of the original model by a metamodel (here, kriging) makes it possible to estimate these indices with precision at a reasonable computational cost.

연구 동기 및 목표

입력 간 의존성을 다루기 위해 글로벌 민감도 분석에서 Shapley 효과의 사용을 동기화한다.
가우시안-선형 및 저차원 상관 설정에서 Shapley 효과에 대한 해석적 결과를 도출한다.
입력 의존성 하에서 Shapley 효과를 1차 및 전체 Sobol’ 지수와 비교한다.
실용적 추정을 위한 Shapley 효과의 모형 기반 알고리즘을 제안하고 평가한다.
의존 입력에 적용 가능한 민감도 분석 설정(FP, FF, VC, FM)을 논의한다.

제안 방법

Sobol’ 지수와 그 의존 입력 확장(전체 및 독립 variants)을 정의한다.
Sobol’-기반 연합에서 도출된 정규화된 공정 분배로서의 Shapley 효과를 c(u) = Var(E[Y|X_u])/Var(Y)로 제시한다.
상관을 가진 2개 또는 3개 변수의 가우시안-선형 모델에 대한 해석적 형태를 분석하여 Shapley 효과를 S_i 및 S_Ti와 비교한다.
상관이 있는 두 변수의 경우 Shapley 효과가 전체 1차 지수와 독립 전체 지수 사이에 위치하는 샌드위치 효과를 보인다는 것을 보여준다.
Shapley 효과의 두 가지 추정 알고리즘: 정확한 순열(permutation) 추정과 무작위 순열(Random permutation) 추정(후자는 차원이 높은 경우에 적합)
실용 모델에서 계산 비용을 줄이기 위한 메타모델 기반 추정(예: 크리깅)을 논의한다.

실험 결과

연구 질문

RQ1입력 변수들이 상관될 때 Shapley 효과는 어떻게 동작하며 의존성 하에서 Sobol’ 지수와 어떤 관계가 있는가?
RQ2상관에 의해 Shapley 효과의 해석을 밝히기 위해 가우시안-선형 설정에서 해석적 표현을 도출할 수 있는가?
RQ3특히 비용이 큰 모델에 대해 Shapley 효과를 위한 효과적인 추정 전략은 무엇이며, 메타모델이 정확도와 비용에 어떤 영향을 미치는가?
RQ4입력 의존성의 존재 하에서 Shapley 효과가 명확한 가이드를 제공하는 민감도 분석 설정(FP, FF, VC, FM)은 무엇인가?
RQ5Sobol’ 지수가 의존성으로 인해 해석하기 어려운 경우 Shapley 효과가 변수 중요성 해석에 어떤 이점을 제공하는가?

주요 결과

Shapley 효과는 의존 입력에서도 합이 1이 되는 음이 아닌 분산 공정 할당을 제공한다.
두 개의 가우시안 입력에서 Shapley 효과는 전체 1차 지수와 독립 전체 지수 사이에 위치하는 샌드위치 효과를 보이며, 상관이 없을 때는 Sobol’ 지수와 같을 수 있다.
모듈식 결과로, 입력이 모델에 나타나지 않더라도 영향력 있는 입력과 상관되어 있으면 Shapley 할당이 비제로 중요도를 부여할 수 있다.
세 개의 가우시안 입력에서 상관 하에 Shapley 효과도 해당 Sobol’ 지수들 사이에 위치하며 샌드위치 특성을 유지하고, 상관 효과가 상관된 입력들에 걸쳐 분배된다.
의존성 하에서 의미 있는 FF 해석을 Shapley 효과가 제공할 수 있으며, Sobol’ 지수만으로는 고정 입력의 영향을 잘 나타내지 못한다.
메타모델 approaches(예: 크리깅)는 Shapley 효과를 더 낮은 계산 비용으로 정확하게 추정하게 해준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.