QUICK REVIEW

[論文レビュー] Gaussian Oracle Inequalities for Structured Selection in Non-Parametric Cox Model

Jelena Bradić, Rui Song|arXiv (Cornell University)|Jul 18, 2012

Statistical Methods and Inference被引用数 4

ひとこと要約

この論文は、右側打ち切りを伴う高次元非パラメトリックコックス回帰モデルにおけるスパースで構造的な変数選択について、有限標本における推論を展開し、グループペナルティと、局所漸近正規性（LAN）を $p \gg n$ の設定に拡張する新しい非漸近的サンドイッチ型境界を導入する。本研究では、適切な打ち切り条件の下で、このモデルにおけるペナルティ付き推定量が線形モデルと同等の予測性能を達成することを確立している。

ABSTRACT

To better understand the interplay of censoring and sparsity we develop finite sample properties of nonparametric Cox proportional hazard's model. Due to high impact of sequencing data, carrying genetic information of each individual, we work with over-parametrized problem and propose general class of group penalties suitable for sparse structured variable selection and estimation. Novel non-asymptotic sandwich bounds for the partial likelihood are developed. We establish how they extend notion of local asymptotic normality (LAN) of Le Cam's. Such non-asymptotic LAN principles are further extended to high dimensional spaces where $p \gg n$. Finite sample prediction properties of penalized estimator in non-parametric Cox proportional hazards model, under suitable censoring conditions, agree with those of penalized estimator in linear models.

研究の動機と目的

打ち切りとスパarsityの間の相互作用が高次元生存解析に与える影響を理解すること。
遺伝子情報に基づくシークエンシングデータに起因する過パラメータ化問題に対処すること。
スパースで構造的な変数選択および推定のための一般クラスのグループペナルティを開発すること。
打ち切り下でのペナルティ付き推定量の有限標本予測特性を確立すること。
局所漸近正規性（LAN）の概念を $p \gg n$ の高次元的・非漸近的設定に拡張すること。

提案手法

非パラメトリックコックス回帰モデルにおける構造的スパarsityを想定した、一般クラスのグループペナルティを提案する。
部分尤度関数のための新しい非漸近的サンドイッチ型境界を構築する。
局所漸近正規性（LAN）の概念を高次元的・有限標本的状態に拡張する。
一般な打ち切りメカニズム下でのペナルティ付き推定量の挙動を分析する。
非パラメトリックコックス回帰モデルにおける予測性能と線形モデルとの関係を確立する。
理論的道具を用いて $p \gg n$ の下での有限標本特性を導出する。

実験結果

リサーチクエスチョン

RQ1打ち切りは、高次元非パラメトリックコックス回帰モデルにおける変数選択および推定にどのように影響を与えるか？
RQ2非漸近的LAN原理を $p \gg n$ の高次元的設定に拡張できるか？
RQ3どのようなグループペナルティ構造が生存解析における効果的なスパースで構造的な選択を可能にするか？
RQ4非パラメトリックコックス回帰モデルにおけるペナルティ付き推定量の有限標本予測特性は、線形モデルにおけるものとどのように比較できるか？
RQ5過パラメータ化された生存モデルにおける信頼性のある推定および選択を保証するための打ち切りに関する条件は何か？

主な発見

部分尤度関数の非漸近的サンドイッチ型境界が導出され、高次元生存モデルにおける有限標本解析が可能になった。
提案されたグループペナルティは構造的スパarsityをサポートし、過パラメータ化された遺伝子データ設定における変数選択に有効である。
LAN原理を高次元的・有限標本的状態に拡張することで、$p \gg n$ の設定における推論の理論的基盤が提供された。
適切な打ち切り条件の下で、非パラメトリックコックス回帰モデルにおけるペナルティ付き推定量の予測特性が線形モデルと一致することが示された。
理論的枠組みにより、予測変数の数が標本サイズを上回る場合でも、信頼性のある推定および選択が可能であることが支持された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。