[논문 리뷰] Some Properties of the Generalized Stuttering Poisson Distribution and its Applications
이 논문은 스타트링 포아송 분포(Stuttering Poisson Distribution, SPD)의 일반화된 형태인 일반화된 스타트링 포아송 분포(GSPD)를 제안하며, 누적모멘트 기반의 모수 추정 방법을 도출하고, 포아송, 음이이항, 삼중 SPD 모델과 비교하여 자동차 보험 청구 데이터에 대해 더 우수한 적합도를 보임을 보여준다. 주요 기여는 비정상적이고 제로가 많은 청구 빈도 데이터를 위한 모델링 정확도를 향상시키기 위해 일관된 누적모멘트 추정 방법을 제공하는 데 있다. 비생명 보험 응용 분야에서의 과분산 및 제로 과다 포화 데이터에 적합한 모델링에 기여한다.
Based on the probability generating function of stuttering Poisson distribution (SPD), this paper considers some equivalent propositions of SPD. From this, we show that some distributions in the application of non-life insurance actuarial science are SPD, such as negative binomial distribution, compound Poisson distribution etc.. By weakening condition of equivalent propositions of SPD, we define the generalized SPD. We consider cumulant estimation of generalized SPD's parameters. As an application, we use SPD with four parameters (4-th SPD) to fit auto insurance claim data. The fitting results show that 4-th SPD is more accurate than negative binomial and Poisson distribution.
연구 동기 및 목표
- 스타트링 포아송 분포(Stuttering Poisson Distribution, SPD)의 구조적 조건을 완화함으로써 일반화된 형태(GSPD)로 확장하는 것.
- 누적모멘트 기반의 GSPD 모수 추정 방법을 개발하여 누적모멘트와 분포 모수 간의 선형 관계를 활용하는 것.
- 실제 자동차 보험 청구 데이터에 대한 네 모수 스타트링 포아송 분포(4-th SPD)의 적합도를 평가하여, 제로 과다 포화 및 과분산 청구 빈도에 대해 성능을 분석하는 것.
- 비생명 보험 정확도 응용 분야에서 전통적인 모델인 포아송 및 음이이항 분포보다 GSPD가 더 나은 통계적 적합도를 제공함을 보여주는 것.
제안 방법
- 확률질량함수 모수에 대한 엄격한 양성 및 정규화 조건을 완화시켜 일반화된 스타트링 포아송 분포(GSPD)를 정의함으로써 더 넓은 적용 가능성을 확보하는 것.
- GSPD의 확률생성함수(PGF)를 유도하고, Faà di Bruno의 공식을 사용하여 분포의 확률질량함수를 누적모멘트와 다항계수 전개로 표현하는 것.
- 역행렬이 가능한 바르데모네 행렬을 통해 표본 누적모멘트와 분포 모수 간의 선형 연립방정식을 수립함으로써 일관된 모수 추정을 가능하게 하는 것.
- 고차원 인덱스의 합산 없이도 효율적으로 확률을 계산할 수 있도록 재귀 공식(예: 라이프니츠 유형)을 사용하여 계산의 실현 가능성을 향상시키는 것.
- 모멘트 및 누적모멘트 추정 기법을 적용하여 4-th SPD의 모수를 추정하고, 표본 모멘트와 누적모멘트를 사용하여 가중치 αi를 구하는 것.
- 관측된 청구 빈도와 피팅된 빈도 간의 피어슨 카이제곱 검정을 수행하여, 포아송, NBD, 3-SPD, 4-SPD 등 경쟁 분포의 적합도를 평가하는 것.
실험 결과
연구 질문
- RQ1스타트링 포아송 분포는 그 확률적 구조를 유지하면서도 더 유연한 모수 제약 조건을 允許할 수 있는가?
- RQ2누적모멘트는 일반화된 스타트링 포아송 분포의 모수를 일관되게 추정하는 데 어떻게 활용될 수 있는가?
- RQ3네 모수 스타트링 포아송 분포(4-th SPD)는 포아송, 음이이항, 또는 삼중 SPD 모델보다 실제 자동차 보험 청구 데이터에 유의미하게 더 나은 적합도를 제공하는가?
- RQ44-th SPD의 추정된 모수는 다중 정책 소유 고객의 확률과 같은 현실적인 청구 행동을 어느 정도 반영하는가?
주요 결과
- 4-th SPD는 자동차 보험 청구 데이터에 대해 가장 우수한 적합도를 보였으며, 피어슨 카이제곱 검정 통계량이 2.8963으로, 음이이항(10.1294), 삼중 SPD(12.5786), 포아송(345.1250)보다 유의미하게 낮았다.
- 표본 누적모멘트가 대수법칙에 따라 모집단 누적모멘트로 수렴함으로써, 누적모멘트 기반 추정 방법이 일관성을 보였다.
- 4-th SPD의 추정 모수는 고객의 0.34%만이 네 개의 정책을 소유함(α4 = 0.00034)을 나타내며, 2.7%는 두 개의 정책을 소유함(α2 = 0.02703)을 반영하여 현실적인 청구 집중 행동을 잘 반영하고 있다.
- 음이이항 분포는 삼중 SPD보다 우수한 성능를 보였지만 4-th SPD보다 열 劣하므로, 사건당 최대 네 건의 청구까지의 고차원 집중을 고려한 모델링이 정확한 모델링을 위해 필수적임을 시사한다.
- Poisson 모델의 경우 Deviance(η = 345.1250)에 비해 4-th SPD 모델의 Deviance(η = 2.8963)가 훨씬 낮아, Poisson 모델이 이 제로 과다 포화 및 과분산 데이터 세트에 부적합함을 확인하였다.
- 본 연구는 음이이항 분포 및 복합 포아송 과정이 일반화된 스타트링 포아송 분포의 특수한 경우임을 확인하여 이의 이론적 기반을 검증하였다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.