Skip to main content
QUICK REVIEW

[論文レビュー] Estimation Of Menarcheal Age Distribution From Imperfectly Recalled Data

Sedigheh Mirzaei Salehabadi, Debasis Sengupta|arXiv (Cornell University)|Oct 10, 2018
Statistical Distribution Estimation and Applications参考文献 8被引用数 1
ひとこと要約

本稿では、記憶の曇りを伴う断続的調査データから月経初潮年齢の分布を推定するための統計モデルを提案する。多項回帰を用いて、月経初潮からの経過時間に応じた記憶確率をモデル化し、記憶の劣化に起因する情報的打ち切りを考慮する。この手法により、部分的記憶データを含めた場合に生存関数推定の精度が向上することがシミュレーションで示された。

ABSTRACT

In a cross-sectional study, adolescent and young adult females were asked to recall the time of menarche, if experienced. Some respondents recalled the date exactly, some recalled only the month or the year of the event, and some were unable to recall anything. We consider estimation of the menarcheal age distribution from this interval censored data. A~complicated interplay between age-at-event and calendar time, together with the evident fact of memory fading with time, makes the censoring informative. We propose a model where the probabilities of various types of recall would depend on the time since menarche. For parametric estimation we model these probabilities using multinomial regression function. Establishing consistency and asymptotic normality of the parametric MLE requires a bit of tweaking of the standard asymptotic theory, as the data format varies from case to case. We also provide a non-parametric MLE, propose a computationally simpler approximation, and establish the consistency of both these estimators under mild conditions. We study the small sample performance of the parametric and non-parametric estimators through Monte Carlo simulations. Moreover, we provide a graphical check of the assumption of the multinomial model for the recall probabilities, which appears to hold for the menarcheal data set. Our analysis shows that the use of the partially recalled part of the data indeed leads to smaller confidence intervals of the survival function.

研究の動機と目的

  • 調査対象者が月経初潮時期を不完全または不正確に記憶している場合に、月経初潮年齢の分布を推定する課題に対処すること。
  • 記憶の正確さが月経初潮からの経過時間に依存することを認識し、記憶の劣化に伴う時間依存性をモデル化すること。
  • 情報的打ち切りが生じる状況下で、月経初潮年齢の生存関数に対する一貫性と漸近正規性を有する推定量を開発すること。
  • モンテカルロシミュレーションを用いて、パラメトリックおよびノンパラメトリック推定量の性能を評価すること。
  • 実データにおける多項回帰記憶確率モデルの妥当性を検証するための図的診断法を提供すること。

提案手法

  • 月経初潮からの経過時間に応じて、正確な日付、月、年、または記憶なしの記憶確率をモデル化する多項回帰フレームワークを用いる。
  • 記憶モデルを介して情報的打ち切りを補正するパラメトリック最尤推定量(MLE)を提案し、月経初潮年齢分布を推定する。
  • 個別に異なるデータ形式が生じる場合に適応した修正された漸近理論を用いて、パラメトリックMLEの一貫性および漸近正規性を確立する。
  • 同じ記憶モデルに基づくノンパラメトリックMLEを構築し、ややきつい正則性条件のもとで一貫性を保証する。
  • 実用的実装を目的として、ノンパラメトリック推定量の計算が簡略化された近似法を導入する。
  • 実データにおける多項回帰モデルの仮定の妥当性を検証するための図的診断ツールを提供する。

実験結果

リサーチクエスチョン

  • RQ1記憶データが区間打ち切りされており、時間に依存する記憶の劣化が生じる状況下で、月経初潮年齢の分布をどのように推定できるか。
  • RQ2部分的記憶データを組み込むことで、生存関数推定の精度がどの程度向上するか。
  • RQ3実際の月経初潮データに対して、多項回帰モデルによる記憶確率の仮定が実証的に妥当であるか。
  • RQ4提案されたパラメトリックおよびノンパラメトリック推定量の有限標本特性は何か。
  • RQ5この推定問題において、個別に異なるデータ形式を扱うために、標準的漸近理論をどのように修正できるか。

主な発見

  • 部分的記憶データを含めた場合、正確な記憶のみを用いた分析と比較して、生存関数の信頼区間が狭くなる。
  • パラメトリックMLEは一貫性と漸近正規性を有しており、データ形式の多様性に起因するため、標準的漸近理論の修正が必要となる理論的裏付けがある。
  • ノンパラメトリックMLEもややきつい正則性条件のもとで一貫性を示し、パラメトリック仮定に対する頑健な代替手法を提供する。
  • モンテカルロシミュレーションにより、両推定量が良好な小標本性能を示すことが確認された。
  • 多項回帰記憶モデルの仮定に対する図的診断は、モデルが実データの月経初潮データに妥当に適合していることを示唆している。
  • 提案されたモデルは、記憶の劣化に起因する情報的打ち切りを効果的に扱い、単純な手法と比較して推定精度を向上させた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。