[논문 리뷰] Modeling Event Dynamics by Self-Exciting Processes with Random Memory
확장된 Hawkes 프로세스를 도입하여 부분적으로 숨겨진 메모리 지속 시간(random, partly hidden memory duration)을 가진 이벤트 시퀀스의 일시적 자기-자극을 모델링하고, 중국 슈퍼리그 데이터를 사용한 축구 코너킥에 적용한다. MCEM, 시뮬레이션, 동적 예측 기능을 제공한다.
Event history data from sports competitions have recently drawn increasing attention in sports analytics to generate data-driven strategies. Such data often exhibit self-excitation in the event occurrence and dependence within event clusters. The conventional event models based on gap times may struggle to capture those features. In particular, while consecutive events may occur within a short timeframe, the self-excitation effect caused by previous events is often transient and continues for a period of uncertain time. This paper introduces an extended Hawkes process model with random self-excitation duration to formulate the dynamics of event occurrence. We present examples of the proposed model and procedures for estimating the associated model parameters. We employ the collection of the corner kicks in the games of the 2019 regular season of the Chinese Super League to motivate and illustrate the modeling and its usefulness. We also design algorithms for simulating the event process under proposed models. The proposed approach can be adapted with little modification in many other research fields such as Criminology and Infectious Disease.
연구 동기 및 목표
- 스포츠 분석 및 기타 도메인에서 일시적 자기-자극을 포착하는 유연한 이벤트-시간 모델의 필요성을 동기화한다.
- 동적 이벤트 강도를 모델링하기 위해 부분적으로 숨겨진 핫-상태 지속 시간(random, partly hidden hot-state duration)을 갖는 확장 Hawkes 프로세스를 도입한다.
- 모델 매개변수에 대해 몬테카를로 EM(MCEM) 프레임워크를 통한 최대우도 추정 방법을 개발한다.
- 2019년 중국 슈퍼리그의 축구 코너킥 데이터를 사용하여 추정, 추론 및 동적 예측을 시연한다.
제안 방법
- 각 이벤트 이후 관찰되지 않는 지속 tau를 따르는 부분적으로 숨겨진 준-마르코프 핫 상태 S(t)와 함께 두-레짐 강도를 정의한다.
- 정규 상태에 대해 lambda0(t|H(t),Z), 핫 상태에 대해 lambda1(t|H(t),Z)를 지정하고 확장된 Hawkes 또는 다른 구성을 통해 자기-자극을 허용한다.
- 모델 하에서 조각별 간격-시간 분포(piecewise gap-time distribution)를 도출하고 tau에서의 변화점(change-point)을 보인다.
- 기저선 및 공변량 처리에서 차이를 보이는 4개의 중첩 구성(모델 a–d)을 제시하여 시간가변 기저선 및 상태-특정 효과를 포함한다.
- 잠복 tau를 처리하기 위해 MCEM을 사용한 최대우도 추정 접근법을 제안하고 E-단계( tau의 시뮬레이션)와 M-단계( 최대화)로 구성한다.
- 일반적인 경우에 대해 깎아내기(thinning) 기반의 시간-동질성 및 시간-가변성 기저선 강도를 포함한 시뮬레이션 알고리즘을 도입한다.
실험 결과
연구 질문
- RQ1이벤트 이후의 무작위 지속 시간의 자기-자극을 포착하는 점 프로세스를 어떻게 모델링할 수 있는가?
- RQ2핫-상태 지속 시간이 잠재되어 있을 때 모델 매개변수를 신뢰성 있게 추정하는 추정 절차는 무엇인가?
- RQ3확장 모델이 표준 Hawkes나 포아송 혼합에 비해 스포츠 데이터의 이벤트 동적을 얼마나 잘 포착하는가?
- RQ4적합된 매개변수 하에서 동적 예측을 제공하고 현실적인 이벤트 시퀀스를 시뮬레이션할 수 있는가?
- RQ5사례/경력 맥락(예: 축구 코너킥)이 무작위 기억 Hawkes 프로세스의 적용성에 어떤 통찰을 제공하는가?
주요 결과
- 잠재 핫-상태 지속 tau는 추정 가능하며 CSL 코너킥 데이터에서 추정된 핫-상태 지속의 평균은 약 2분으로, 짧지만 측정 가능한 자극을 시사한다.
- 홈팀과 어웨이 팀의 공변량 효과가 다르게 나타나며, 리드를 잡은 경우 홈 팀이 킥 비율이 더 낮고, 후반에는 어웨이 팀의 비율이 더 높다; 효과는 모델 구성을 넘나들며 지속된다.
- 핫 상태의 공변량 효과는 통계적으로 유의하지 않아, 자극은 주로 핫 윈도우 내의 기전으로 인해 발생하고 공변량보다는 그 기전에 의해 주도된다는 것을 시사한다.
- 기저선 강도 패턴은 세그먼트 내에서 시간에 따라 변하며, 제안된 모델들(b–d)은 상수 기저선(Model a)보다 이러한 패턴을 더 잘 포착한다.
- 이 프레임워크는 코너킥 강도의 동적 예측을 가능하게 하며, 제안된 시뮬레이션 알고리즘을 통해 합성 이벤트 데이터를 생성하고 짧은 기간의 자극과 세그먼트별 기저선을 보존한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.