Skip to main content
QUICK REVIEW

[논문 리뷰] Bounding the Estimation Error of Sampling-based Shapley Value Approximation With/Without Stratifying.

Sasan Maleki, The Anh Han|arXiv (Cornell University)|2013. 06. 18.
Game Theory and Voting Systems인용 수 24
한 줄 요약

이 논문은 알려진 분산 또는 경계값을 가진 마진 기여의 범위에 따라, 표본 기반 샤플리 값 근사의 추정 오차에 대한 비점근적 경계를 제시한다. 특히, 분산이 큰 경우 기존의 O(r/√m)에서 O(√r/√m)로 오차 경계를 향상시켜 실용적 응용에 대해 더 날카롭고 유한 표본 기반의 보장을 제공한다.

ABSTRACT

The Shapley value is arguably the most central normative solution concept in cooperative game theory. It specifies a unique way in which the reward from cooperation can be fairly divided among players. While it has a wide range of real world applications, its use is in many cases hampered by the hardness of its computation. A number of researchers have tackled this problem by (1) focusing on classes of games where the Shapley value can be computed efficiently, or (2) proposing representation formalisms that facilitate such efficient computation, or (3) approximating the Shapley value in certain classes of games. However, given the classical extit{characteristic function} representation, the only attempt to approximate the Shapley value for the general class of games is due to Castro extit{et al.} \cite{castro}. While this algorithm provides a bound on the approximation error, this bound is extit{asymptotic}, meaning that it only holds when the number of samples increases to infinity. On the other hand, when a finite number of samples is drawn, an unquantifiable error is introduced, meaning that the bound no longer holds. With this in mind, we provide non-asymptotic bounds on the estimation error for two cases: where (1) the extit{variance}, and (2) the extit{range}, of the players' marginal contributions is known. Furthermore, for the second case, we show that when the range is significantly large relative to the Shapley value, the bound can be improved (from $O(r,\sqrt{ icefrac{1}{m}})$ to $O(\sqrt{r},\sqrt{ icefrac{1}{m}})$). Finally, we propose, and demonstrate the effectiveness of, using stratified sampling to improve the bounds.

연구 동기 및 목표

  • 기존의 표본 기반 샤플리 값 근사 방법에서의 유한 표본 오차 경계 부족 문제를 해결한다.
  • 알려진 마진 기여의 분산 또는 범위 조건 하에서 일반 협력 게임에 대한 비점근적 추정 오차 경계를 제공한다.
  • 마진 기여의 범위가 샤플리 값보다 크게 증가할 경우 오차 경계를 향상시킨다.
  • 계층적 표본 추출이 샤플리 값 근사의 추정 오차 경계를 좁히는 데 얼마나 효과적인지 조사한다.

제안 방법

  • 마진 기여의 분산이 알려져 있다고 가정할 때, 유한한 수의 표본을 사용하여 샤플리 값의 추정 오차에 대한 비점근적 상한 경계를 유도한다.
  • 범위 기반의 대안적 경계를 제시하며, 이는 마진 기여의 범위가 샤플리 값에 비해 클 경우 더 날카롭다.
  • 범위가 높은 조건에서 수렴 속도를 O(r/√m)에서 O(√r/√m)로 향상시키는 수정된 경계를 도입한다.
  • 분산을 줄이고 오차 경계의 날카기 정도를 향상시키기 위해 계층적 표본 추출 전략을 제안하고 분석한다.
  • 농도 불등식을 사용하여 오차 경계를 수식화하며, 표본 수 m과 마진 기여의 범위 또는 분산에 명시적인 의존성을 포함한다.
  • 균일 표본 추출과 계층적 표본 추출의 이론적 성능을 오차 경계의 날카기 정도 측면에서 비교한다.

실험 결과

연구 질문

  • RQ1마진 기여의 분산만 알려져 있을 때, 표본 기반 샤플리 값 근사에 대해 비점근적 오차 경계를 도출할 수 있는가?
  • RQ2마진 기여의 범위가 추정 오차 경계의 날카기 정도에 어떤 영향을 미치는가?
  • RQ3마진 기여의 범위가 샤플리 값보다 크게 증가할 경우 오차 경계를 향상시킬 수 있는가?
  • RQ4계층적 표본 추출이 균일 표본 추출에 비해 샤플리 값 근사에서 추정 오차를 얼마나 줄이는가?

주요 결과

  • 논문은 마진 기여의 분산이 알려진 조건 하에서 표본 기반 샤플리 값 근사에 대한 비점근적 오차 경계를 수립한다.
  • 마진 기여의 범위가 샤플리 값보다 크게 증가할 경우, 오차 경계는 기존의 O(r/√m)에서 O(√r/√m)로 향상된다.
  • 계층적 표본 추출은 추정 오차를 효과적으로 줄이며, 균일 표본 추출에 비해 더 날카운 경계를 이끈다.
  • 유도된 경계는 이전 연구가 점근적 근사에 의존한 것과 달리, 임의의 유한한 표본 수에 대해 유효하다.
  • 이론적 분석은 오차 경계가 표본 수와 마진 기여의 분포 범위에 모두 의존함을 확인한다.
  • 범위가 높은 조건에서의 경계 날카기 정도 향상은 극단적인 마진 기여 값을 갖는 게임에 집중하는 데 이론적 근거를 제공한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.