Skip to main content
QUICK REVIEW

[논문 리뷰] Frequentist coverage and sup-norm convergence rate in Gaussian process regression

Yun Yang, Anirban Bhattacharya|arXiv (Cornell University)|2017. 08. 16.
Gaussian Processes and Bayesian Inference참고 문헌 38인용 수 36
한 줄 요약

이 논문은 랜덤 설계 하에서 가우시안 프로세스 회귀에서 베이지안 신뢰구간과 구간의 빈도주의 커버리지 이론을 수립하며, 과소 스무쓰닝된 사전분포가 주어질 경우 커버리지가 명목 수준과 1 사이의 비퇴화된 값으로 수렴하는 보수적인 추론을 보임을 보여준다. 새로운 버진-빈 민츠 결과를 통해 초월 노름에서 최소 최대 최적의 사후 수축률을 유도하였으며, 이는 가우시안 비교 정리와 사후의 정규화된 M-추정량 근사에 의해 검증된다.

ABSTRACT

Gaussian process (GP) regression is a powerful interpolation technique due to its flexibility in capturing non-linearity. In this paper, we provide a general framework for understanding the frequentist coverage of point-wise and simultaneous Bayesian credible sets in GP regression. As an intermediate result, we develop a Bernstein von-Mises type result under supremum norm in random design GP regression. Identifying both the mean and covariance function of the posterior distribution of the Gaussian process as regularized $M$-estimators, we show that the sampling distribution of the posterior mean function and the centered posterior distribution can be respectively approximated by two population level GPs. By developing a comparison inequality between two GPs, we provide exact characterization of frequentist coverage probabilities of Bayesian point-wise credible intervals and simultaneous credible bands of the regression function. Our results show that inference based on GP regression tends to be conservative; when the prior is under-smoothed, the resulting credible intervals and bands have minimax-optimal sizes, with their frequentist coverage converging to a non-degenerate value between their nominal level and one. As a byproduct of our theory, we show that the GP regression also yields minimax-optimal posterior contraction rate relative to the supremum norm, which provides a positive evidence to the long standing problem on optimal supremum norm contraction rate in GP regression.

연구 동기 및 목표

  • 랜덤 설계 하에서 가우시안 프로세스 회귀에서의 베이지안 신뢰집합의 빈도주의 타당성을 위한 이론적 프레임워크 수립.
  • GP 회귀에서 초월 노름에서 최적의 사후 수축률을 구하는 오랜 동안 미해결된 문제 해결.
  • 사전분포가 잘못 지정되거나 과소 스무쓰닝되었을 경우 점별 및 동시 신뢰집합의 커버리지 행동 특성 규명.
  • GP 회귀에서 초월 노름에서의 버진-빈 민츠 유형 결과 개발하여 사후 행동과 정규화된 M-추정량 간의 연결 고리 확립.
  • 가우시안 비교 정리와 초월 노름에서의 사후 근사에 기반한 빈도주의 커버리지 확률의 정확한 특성화 제공.

제안 방법

  • 사후 평균과 중심화된 사후 분포를 두 개의 인구 수준 가우시안 과정으로 근사함으로써 사후의 빈도주의 분석 가능.
  • 논문은 사후 평균과 공분산이 정규화된 M-추정량임을 규명하여 베이지안 GP 회귀를 빈도주의 추정 이론과 연결.
  • 사후가 진실과의 초월 노름 편차를 제한하기 위해 새로운 가우시안 과정 간 비교 부등식을 개발.
  • 함수와 입력 공간에 따라 인덱스가 지정된 확률적 과정의 최대값을 제어하기 위해 잘라낸 텔레스코프 합을 사용한 체이닝 추론에 기반.
  • 함수 공간의 커버링 수를 소볼레프 유형의 엔트로피 조건을 통해 유계로 제한하며, 함수 클래스의 정규성에 의해 메트릭 엔트로피 제어.
  • 하나의 정밀한 농도 불등식을 사용하여 하중형 초과 증분 하에서의 농도를 분석하며, 체이닝과 메트릭 엔트로피 고려에 기반한 경계 유도.

실험 결과

연구 질문

  • RQ1랜덤 설계 하에서 GP 회귀에서 점별 신뢰구간의 빈도주의 커버리지 확률은 무엇인가?
  • RQ2사전분포가 진실보다 과소 스무쓰닝되었을 경우 동시 신뢰밴드의 커버리지 행동은 어떻게 되는가?
  • RQ3GP 회귀는 초월 노름에서 최소 최대 최적의 사후 수축률을 달성하는가?
  • RQ4랜덤 설계 설정에서 GP 회귀에 대해 초월 노름에서 버진-빈 민츠 정리를 수립할 수 있는가?
  • RQ5비모수적 GP 회귀에서 사전의 스무쓰닝과 베이지안 신뢰집합의 渐近 커버리지 간의 관계는 무엇인가?

주요 결과

  • GP 회귀에서의 신뢰구간과 밴드는 보수적이다: 사전분포가 과소 스무쓰닝되었을 경우 빈도주의 커버리지가 명목 수준과 1 사이의 비퇴화된 값으로 수렴한다.
  • 초월 노름에서의 사후 수축률은 최소 최대 최적이다. 이는 GP 회귀에서 오랫동안 미해결되었던 문제에 대한 긍정적 해결이다.
  • 사후 평균과 중심화된 사후 분포의 표본 분포는 점차적으로 두 개의 인구 수준 가우시안 과정으로 근사되며, 이는 빈도주의 추론 가능하게 한다.
  • 초월 노름에서 버진-빈 민츠 유형 결과가 성립하며, 적절한 정규성 조건 하에서 사후가 진실 함수를 최소 최대 속도로 집중한다.
  • 신뢰집합의 커버리지가 사전의 스무쓰닝에 매우 민감하게 의존한다: 스무쓰닝이 일치할 경우 점 渐近 명목 커버리지 달성, 과소 스무쓰닝 시 보수적 커버리지 및 최적 크기 확보.
  • 이론적으로 초월 노름에서의 사후 수축률이 진실의 정규성과 사전의 정규성의 합으로 유계임을 입증하였으며, 표본 크기와 설계 밀도에 명시적인 의존성 포함.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.