QUICK REVIEW

[論文レビュー] A theoretical foundation of the target-decoy search strategy for false discovery rate control in proteomics

Kun He, Yan Fu|arXiv (Cornell University)|Jan 3, 2015

Advanced Proteomics Techniques and Applications参考文献 17被引用数 41

ひとこと要約

本論文は、プロテオミクスにおけるターゲットデコイサーチ（TDS）戦略の厳密な統計的基盤を確立し、標準的な連結TDSアプローチがFDR（誤り発見率）を保守的に推定するが、厳密に制御するものではないことを証明している。著者らはFDR推定式を変更することで、ペプチドレベルでのFDRを厳密に制御できることを示しており、スプライスメントレベルでのFDR制御は依然として困難であることが、実際の質量分析データを用いて検証された。

ABSTRACT

Motivation: Target-decoy search (TDS) is currently the most popular strategy for estimating and controlling the false discovery rate (FDR) of peptide identifications in mass spectrometry-based shotgun proteomics. While this strategy is very useful in practice and has been intensively studied empirically, its theoretical foundation has not yet been well established. Result: In this work, we systematically analyze the TDS strategy in a rigorous statistical sense. We prove that the commonly used concatenated TDS provides a conservative estimate of the FDR for any given score threshold, but it cannot rigorously control the FDR. We prove that with a slight modification to the commonly used formula for FDR estimation, the peptide-level FDR can be rigorously controlled based on the concatenated TDS. We show that the spectrum-level FDR control is difficult. We verify the theoretical conclusions with real mass spectrometry data.

研究の動機と目的

質量分析を用いたプロテオミクス分野で広く用いられているターゲットデコイサーチ（TDS）戦略の厳密な統計的基盤を確立すること。
標準的な連結TDS手法が、FDR推定を保守的に行い、かつ厳密なFDR制御を達成するかどうかを調査すること。
ペプチドレベルおよびスプライスメントレベルでFDRを厳密に制御できる条件を同定すること。
ペプチドレベルの解析において厳密なFDR制御を可能にする、修正されたFDR推定式を提案すること。
理論的予測を実際の質量分析データセットを用いて検証すること。

提案手法

確率的枠組みに基づくターゲットデコイサーチ戦略の形式的統計的分析。
連結TDS設定下でのFDR推定式の導出により、その保守的性質を示すこと。
標準TDS式が、保守的であっても厳密なFDR制御を保証しないことの証明。
ペプチドレベルでの厳密なFDR制御を保証する、修正されたFDR推定式の導入。
スプライスメントレベルでのFDR制御の数学的分析により、内在的な理論的制限を明らかにすること。
実際のショットガンプロテオミクス質量分析データを用いた実証的検証により、理論的予測の妥当性を確認すること。

実験結果

リサーチクエスチョン

RQ1標準的な連結ターゲットデコイサーチ戦略は、誤り発見率の保守的推定を提供するか？
RQ2ターゲットデコイ戦略を用いてペプチドレベルでの誤り発見率を厳密に制御できるか？
RQ3なぜターゲットデコイフレームワーク下ではスプライスメントレベルでのFDR制御が本質的に困難なのか？
RQ4FDR推定式にどのような修正を加えることで、ペプチド同定における厳密なFDR制御が可能になるか？
RQ5FDR推定に関する理論的予測は、実プロテオミクスデータにおける経験的観察と整合するか？

主な発見

標準的な連結ターゲットデコイサーチは、任意のスコア閾値に対して、誤り発見率を保守的に推定する。
保守的であるにもかかわらず、標準TDS手法は厳密な誤り発見率制御を保証しない。
修正されたFDR推定式により、TDSフレームワーク下でペプチドレベルの誤り発見率を厳密に制御できる。
スプライスメントレベルでのFDR制御は理論的に困難であり、現在のTDSアプローチでは信頼性を持って達成できない。
実際の質量分析データを用いた実証的検証により、FDR推定および制御に関する理論的予測が確認された。
本研究は、プロテオミクス分野で広く用いられているターゲットデコイ戦略の形式的統計的基盤を確立した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。