Skip to main content
QUICK REVIEW

[논문 리뷰] Estimation Of Menarcheal Age Distribution From Imperfectly Recalled Data

Sedigheh Mirzaei Salehabadi, Debasis Sengupta|arXiv (Cornell University)|2018. 10. 10.
Statistical Distribution Estimation and Applications참고 문헌 8인용 수 1
한 줄 요약

이 논문은 기억 상실이 있는 횡단적 설문 조사 자료에서 생애 주기 연령 분포를 추정하기 위한 통계 모델을 제안한다. 다항 회귀를 사용해 기억 확률을 생애 이후 경과 시간의 함수로 모델링함으로써 기억 상실로 인한 정보적 케이서링을 고려한다. 이 방법은 기억 상실로 인한 정보적 케이서링을 반영하며, 파라미터적 및 비모수적 추정기법을 제공하며, 시뮬레이션 결과 부분적으로 기억된 자료를 포함할 경우 생존함수 추정의 정밀도가 향상됨을 보여준다.

ABSTRACT

In a cross-sectional study, adolescent and young adult females were asked to recall the time of menarche, if experienced. Some respondents recalled the date exactly, some recalled only the month or the year of the event, and some were unable to recall anything. We consider estimation of the menarcheal age distribution from this interval censored data. A~complicated interplay between age-at-event and calendar time, together with the evident fact of memory fading with time, makes the censoring informative. We propose a model where the probabilities of various types of recall would depend on the time since menarche. For parametric estimation we model these probabilities using multinomial regression function. Establishing consistency and asymptotic normality of the parametric MLE requires a bit of tweaking of the standard asymptotic theory, as the data format varies from case to case. We also provide a non-parametric MLE, propose a computationally simpler approximation, and establish the consistency of both these estimators under mild conditions. We study the small sample performance of the parametric and non-parametric estimators through Monte Carlo simulations. Moreover, we provide a graphical check of the assumption of the multinomial model for the recall probabilities, which appears to hold for the menarcheal data set. Our analysis shows that the use of the partially recalled part of the data indeed leads to smaller confidence intervals of the survival function.

연구 동기 및 목표

  • 설문 응답자가 생애 주기 연령을 완전하거나 정확하게 기억하지 못할 경우 생애 주기 연령 분포를 추정하는 데 도전하는 문제를 해결하기 위해.
  • 기억 정확도가 생애 이후 경과 시간에 따라 달라지는 것, 즉 기억이 시간이 지남에 따라 흐려진다는 점을 인식하고, 이를 모델링하기 위해.
  • 정보적 케이서링 하에서 생애 주기 연령의 생존함수에 대해 일致하고 점근적으로 정규분포를 따르는 추정기법을 개발하기 위해.
  • 몬테카를로 시뮬레이션을 통해 파라미터적 및 비모수적 추정기법의 성능을 평가하기 위해.
  • 실제 데이터에서 다항 기억 확률 모델의 타당성을 점검하기 위한 그래픽 진단 도구를 제공하기 위해.

제안 방법

  • 기억한 날짜, 월, 연도 또는 전혀 기억하지 못한 확률이 생애 이후 경과 시간에 따라 달라지는 다항 회귀 프레임워크를 사용해 기억 확률을 모델링한다.
  • 기억 모델을 통해 정보적 케이서링을 보정하면서 생애 주기 연령 분포에 대한 파라미터적 최대우도추정기(MLE)를 제안한다.
  • 개별 사례의 데이터 형식 이질성로 인해 표준 점근 이론을 수정한 이론적 기반을 통해 파라미터적 MLE의 일관성과 점근 정규성을 입증한다.
  • 동일한 기억 모델 하에서 생존함수에 대한 비모수적 MLE를 개발하며, 미약한 정규성 조건 하에서 일관성을 보장한다.
  • 실제 적용을 위해 비모수적 추정기의 계산이 간편한 근사치를 제안한다.
  • 실제 데이터에서 다항 기억 모델의 가정이 타당한지 평가하기 위한 그래픽 진단 도구를 제공한다.

실험 결과

연구 질문

  • RQ1기억 자료가 간격 케이서링되어 있고 시간에 따라 기억 상실이 발생할 경우, 생애 주기 연령 분포는 어떻게 추정할 수 있는가?
  • RQ2부분적으로 기억된 자료를 포함할 경우 생존함수 추정의 정밀도는 어느 정도 향상되는가?
  • RQ3기억 확률에 대한 다항 모델의 가정이 실제 생애 주기 연령 자료에 대해 실증적으로 타당한가?
  • RQ4제안된 파라미터적 및 비모수적 추정기법의 유한표본 성질은 어떠한가?
  • RQ5이 추정 문제에서 개별 사례의 데이터 형식을 다루기 위해 표준 점근 이론은 어떻게 수정되어야 하는가?

주요 결과

  • 부분적으로 기억된 자료를 포함할 경우, 정확한 기억만을 사용한 분석에 비해 생존함수에 대한 신뢰구간이 더 좁아진다.
  • 파라미터적 MLE는 일관성 있고 점근적으로 정규분포를 따르며, 데이터 형식의 이질성로 인해 표준 점근 이론을 수정한 이론적 근거가 필요하다.
  • 비모수적 MLE 역시 미약한 정규성 조건 하에서 일관성을 보이며, 파라미터적 가정에 대한 강력한 대안을 제공한다.
  • 몬테카를로 시뮬레이션 결과 파라미터적 및 비모수적 추정기법 모두 양호한 소표본 성능을 보였다.
  • 다항 기억 모델의 가정을 점검하기 위한 그래픽 진단 도구는 모델이 실질적인 생애 주기 연령 자료에 합리적으로 적합함을 시사한다.
  • 제안된 모델은 기억 상실로 인한 정보적 케이서링을 효과적으로 반영하여, 단순한 방법에 비해 추정 정확도를 향상시킨다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.