Skip to main content
QUICK REVIEW

[논문 리뷰] A theoretical foundation of the target-decoy search strategy for false discovery rate control in proteomics

Kun He, Yan Fu|arXiv (Cornell University)|2015. 01. 03.
Advanced Proteomics Techniques and Applications참고 문헌 17인용 수 41
한 줄 요약

이 논문은 단백질체 분석에서 널리 사용되는 타겟-데코이 검색(TDS) 전략에 엄밀한 통계적 기반을 확립하며, 표준 연결된 TDS 방법이 잘못 발견률(FDR)을 과잉 추정하지만 엄격한 FDR 제어를 보장하지 못함을 증명한다. 저자들은 FDR 추정 공식을 수정함으로써 펩타이드 수준의 FDR를 엄격히 제어할 수 있음을 보여주며, 스펙트럼 수준의 FDR 제어는 여전히 도전 과제임을 실질적인 질량 분석 데이터를 통해 검증한다.

ABSTRACT

Motivation: Target-decoy search (TDS) is currently the most popular strategy for estimating and controlling the false discovery rate (FDR) of peptide identifications in mass spectrometry-based shotgun proteomics. While this strategy is very useful in practice and has been intensively studied empirically, its theoretical foundation has not yet been well established. Result: In this work, we systematically analyze the TDS strategy in a rigorous statistical sense. We prove that the commonly used concatenated TDS provides a conservative estimate of the FDR for any given score threshold, but it cannot rigorously control the FDR. We prove that with a slight modification to the commonly used formula for FDR estimation, the peptide-level FDR can be rigorously controlled based on the concatenated TDS. We show that the spectrum-level FDR control is difficult. We verify the theoretical conclusions with real mass spectrometry data.

연구 동기 및 목표

  • 질량 분석 기반 단백질체 분석에서 널리 사용되는 타겟-데코이 검색(TDS) 전략에 엄밀한 통계적 기반을 마련하는 것.
  • 표준 연결된 TDS 방법이 잘못 발견률(FDR) 추정을 어떻게 제공하는지, 그리고 엄격한 FDR 제어를 보장하는지 조사하는 것.
  • 펩타이드 수준과 스펙트럼 수준에서 FDR를 엄격히 제어할 수 있는 조건을 규명하는 것.
  • 펩타이드 수준 분석에서 엄격한 FDR 제어를 가능하게 하는 수정된 FDR 추정 공식을 제안하는 것.
  • 이론적 예측을 실질적인 질량 분석 데이터셋을 통해 검증하는 것.

제안 방법

  • 확률적 프레임워크 하에서 타겟-데코이 검색 전략에 대한 공식적인 통계 분석.
  • 연결된 TDS 설정 하에서 FDR 추정 공식 유도하여 그 과잉 추정 성향을 입증.
  • 표준 TDS 공식이 비록 과잉 추정이지만 엄격한 FDR 제어를 보장하지 못함을 증명.
  • 펩타이드 수준에서 엄격한 FDR 제어를 보장하는 수정된 FDR 추정 공식 도입.
  • 스펙트럼 수준의 FDR 제어에 대한 수학적 분석을 통해 내재된 이론적 한계를 규명.
  • 실제 샷건 단백질체 질량 분석 데이터를 활용한 실증적 검증을 통해 이론적 예측을 확인.

실험 결과

연구 질문

  • RQ1표준 연결된 타겟-데코이 검색 전략은 잘못 발견률(FDR)을 과잉 추정하는가?
  • RQ2타겟-데코이 전략을 사용하여 펩타이드 수준에서 잘못 발견률을 엄격히 제어할 수 있는가?
  • RQ3왜 타겟-데코이 프레임워크 하에서 스펙트럼 수준의 FDR 제어가 본질적으로 어려운가?
  • RQ4어떤 수정을 통해 FDR 추정 공식이 펩타이드 식별에서 엄격한 FDR 제어를 가능하게 하는가?
  • RQ5이론적 예측과 실제 단백질체 데이터에서의 관찰 결과 사이의 일치 정도는 어떠한가?

주요 결과

  • 표준 연결된 타겟-데코이 검색은 주어진 점수 임계값에 대해 잘못 발견률(FDR)을 과잉 추정한다.
  • 비록 과잉 추정이지만 표준 TDS 방법은 엄격한 FDR 제어를 보장하지 못한다.
  • 수정된 FDR 추정 공식을 통해 TDS 프레임워크 하에서 펩타이드 수준의 잘못 발견률을 엄격히 제어할 수 있다.
  • 스펙트럼 수준의 FDR 제어는 여전히 이론적으로 도전적이며, 현재의 TDS 접근 방식으로는 신뢰할 만하게 달성할 수 없다.
  • 실제 질량 분석 데이터를 활용한 실증 검증을 통해 FDR 추정 및 제어에 대한 이론적 예측이 확인되었다.
  • 본 연구는 단백질체 분석에서 타겟-데코이 전략의 광범위한 사용에 대한 공식적인 통계적 기반을 확립하였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.