Skip to main content
QUICK REVIEW

[論文レビュー] Positive-unlabeled convolutional neural networks for particle picking in cryo-electron micrographs

Tristan Bepler, Andrew Morin|PubMed|Mar 22, 2018
Advanced Electron Microscopy Techniques and Applications参考文献 2被引用数 179
ひとこと要約

この論文は、少数のラベル付き粒子と多数のラベルなし粒子を用いて CNN を訓練する PU 学習を利用した cryo-EM 用の粒子選択パイプライン Topaz を紹介し、最小限のラベリングで再構成品質を向上させる。

ABSTRACT

Cryo-electron microscopy (cryoEM) is an increasingly popular method for protein structure determination. However, identifying a sufficient number of particles for analysis (often >100,000) can take months of manual effort. Current computational approaches are limited by high false positive rates and require significant ad-hoc post-processing, especially for unusually shaped particles. To address this shortcoming, we develop Topaz, an efficient and accurate particle picking pipeline using neural networks trained with few labeled particles by newly leveraging the remaining unlabeled particles through the framework of positive-unlabeled (PU) learning. Remarkably, despite using minimal labeled particles, Topaz allows us to improve reconstruction resolution by up to 0.15 Å over published particles on three public cryoEM datasets without any post-processing. Furthermore, we show that our novel generalized-expectation criteria approach to PU learning outperforms existing general PU learning approaches when applied to particle detection, especially for challenging datasets of non-globular proteins. We expect Topaz to be an essential component of cryoEM analysis.

研究の動機と目的

  • cryo-EM における効率的な粒子選択を動機づけ、手動による注釈作業を削減する。
  • Positive-Unlabeled 学習を通じてラベルなし粒子を活用する学習フレームワークを提案する。
  • 限られたラベルデータで訓練された CNN ベースの粒子ピッカー(Topaz)を開発する。
  • ポスト処理なしで公開 cryo-EM データセット上の再構成品質の向上を実証する。
  • 難しいデータセットに対する generalized-expectation PU 基準の優位性を示す。

提案手法

  • cryo-EM 用の CNN ベースの粒子ピッカー Topaz を開発する。
  • Positive-Unlabeled (PU) 学習を用いてラベルなし粒子を活用するようにネットワークを訓練する。
  • PU 学習のための generalized-expectation 基準を導入する。
  • この方法を3つの公開 cryo-EM データセットに適用し、再構成結果を比較する。
  • ポスト処理なしで再構成分解能の改善を評価する。

実験結果

リサーチクエスチョン

  • RQ1PU 学習は cryo-EM において非常に少数のラベル付き例で正確な粒子ピックを実現できるか?
  • RQ2ラベルなし粒子を活用することでピックの精度と下流の再構成品質は向上するか?
  • RQ3非球状粒子に対して、一般化期待値 PU 基準は既存の PU 手法と比較してどのように性能を発揮するか?
  • RQ4Topaz が公開データセットで達成する実用的な再構成精度の向上はどれくらいか?

主な発見

  • Topaz は three public datasets 上で、公開粒子より最大 0.15 Å の再構成分解能の改善を達成する。
  • PU 学習は最小限のラベルデータで高品質な粒子検出を可能にする。
  • 難易度の高い非球状粒子に対して、一般化期待値 PU 基準は既存の PU 手法を上回る。
  • Topaz は粒子ピックにおけるアドホックなポスト処理の必要性を減らすか、なくす。
  • この手法は cryo-EM 分析の重要な要素として提示される。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。