QUICK REVIEW

[論文レビュー] Continuous shrinkage prior revisited: a collapsing behavior and remedy

Se Yoon Lee, Debdeep Pati|arXiv (Cornell University)|Jul 4, 2020

Gaussian Processes and Bayesian Inference参考文献 23被引用数 2

ひとこと要約

この論文は、多くの真の信号が存在する場合に、グローバルスケールの過小評価により事後平均がゼロに収束する連続的スリクージングプライアの崩壊行動を特定する。これを是正するため、尾指数を自己適応的に学習するグローバルローカルテイルスリクージングプライアを提案し、中程度の信号数を持つ高次元ゲノム設定における推定精度を向上させる。

ABSTRACT

Modern genomic studies are increasingly focused on identifying more and more genes clinically associated with a health response. Commonly used Bayesian shrinkage priors are designed primarily to detect only a handful of signals when the dimension of the predictors is very high. In this article, we investigate the performance of a popular continuous shrinkage prior in the presence of relatively large number of true signals. We draw attention to an undesirable phenomenon; the posterior mean is rendered very close to a null vector, caused by a sharp underestimation of the global-scale parameter. The phenomenon is triggered by the absence of a tail-index controlling mechanism in the Bayesian shrinkage priors. We provide a remedy by developing a global-local-tail shrinkage prior which can automatically learn the tail-index and can provide accurate inference even in the presence of moderately large number of signals. The collapsing behavior of the Horseshoe with its remedy is exemplified in numerical examples and in two gene expression datasets.

研究の動機と目的

通常のスパース信号検出を想定して設計された連続的スリクージングプライアが、真の信号数が中程度に多い場合にどのように性能を発揮するかを調査すること。
既存のプライアにおける事後分布の崩壊の根本的要因を同定すること、特にグローバルスケールパラメータの鋭い過小評価である。
標準的なベイジアンスリクージングプライアに尾指数制御機構が欠如していることにより、信号が密集する状況下で推論が悪化することの原因を特定すること。
尾指数を自動的に学習する新しいプライアを開発し、多くの信号が存在する状況でも正確な事後分布推論を維持できることを目的とする。
数値例および実際の遺伝子発現データセットを通じて、提案手法の有効性を検証すること。

提案手法

標準的なグローバルローカルプライアを拡張し、重たい尾の挙動を制御するための柔軟な尾指数パラメータを導入したグローバルローカルテイルスリクージングプライアを提案する。
尾指数をデータから推定する階層的プライア構造を導入し、真の信号集合のスパarsityレベルに自動的に適応可能にする。
スケール混合表現を用いてプライアを階層モデルとして表現し、ギブスサンプリングや同様のMCMC手法による効率的な事後分布計算を可能にする。
尾指数に非情報的または弱情報的プライアを組み込むことで、強い仮定を設けずにデータ駆動の学習を可能にする。
ハーシュースの性質を保ちつつ、グローバルスケール推定の安定化により事後分布の崩壊を回避するようにプライアを設計する。
ベイジアンフレームワーク内でモデルを実装し、信号スパarsityレベルを変化させた状況での事後平均性能を評価する。

実験結果

リサーチクエスチョン

RQ1なぜ標準的な連続的スリクージングプライアは、高次元設定下で中程度の数の真の信号を検出できないのか？
RQ2既存のグローバルローカルプライアにおいて、事後平均がゼロに収束する原因となるメカニズムは何か？
RQ3尾指数制御機構の欠如が、グローバルスケールパラメータの過小評価にどのように寄与するのか？
RQ4尾指数を自己適応的に学習するプライアを設計することで、信号が密集する状況でも正確なスリクージングを維持できるか？
RQ5提案されたグローバルローカルテイルプライアは、実際のゲノムデータにおける事後平均の正確性および信号検出能力において、既存のプライアと比べてどのように差を示すか？

主な発見

真の信号数が増加すると、特に中程度の増加であっても、グローバルスケールパラメータの深刻な過小評価により、標準的な連続的スリクージングプライアの事後平均がゼロに収束する。
この崩壊行動は、既存のプライアに尾指数制御機構が欠如していることに起因し、非ノンアル効果の過剰スリクージングを引き起こす。
提案されたグローバルローカルテイルスリクージングプライアは、データから尾指数を自己適応的に学習することで、事後分布の崩壊を効果的に緩和する。
数値例では、新しいプライアがさまざまな信号スパarsityレベルにおいて正確な事後平均推定を維持していることが示された。
2つの実際の遺伝子発現データセットにおいて、提案手法は標準的なホーシュープライアおよび関連するプライアを上回り、真の信号の検出と効果量の推定において優れた性能を示した。
中程度の信号密度に対しても頑健であることが示され、臨床的関連性の高い遺伝子数が増加する現代のゲノム研究における実用的解決策を提供する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。