[論文レビュー] A Multi-Pass Approach to Large-Scale Connectomics
本論文は、大規模な電子顕微鏡データからのニューロン形態のリアルタイムで高スループットな再構成を可能にする、マルチパス接続ゲノミクスパイプラインを提示する。最適化された畳み込みニューラルネットワークを用いた高速パスによるセグメンテーションと、ウォーターシェドベースの過剰セグメンテーションに続く、誤り訂正のためのスローパス(特に結合誤りと断たれた軸索の訂正)を組み合わせることで、1台のマルチコアシステムで1時間あたりほぼテラバイトの処理が可能となり、Kasthuriデータセット(463 GB)をわずか5時間で再構成した。これは従来の分散システムと比較して90%の処理時間短縮である。
The field of connectomics faces unprecedented "big data" challenges. To reconstruct neuronal connectivity, automated pixel-level segmentation is required for petabytes of streaming electron microscopy data. Existing algorithms provide relatively good accuracy but are unacceptably slow, and would require years to extract connectivity graphs from even a single cubic millimeter of neural tissue. Here we present a viable real-time solution, a multi-pass pipeline optimized for shared-memory multicore systems, capable of processing data at near the terabyte-per-hour pace of multi-beam electron microscopes. The pipeline makes an initial fast-pass over the data, and then makes a second slow-pass to iteratively correct errors in the output of the fast-pass. We demonstrate the accuracy of a sparse slow-pass reconstruction algorithm and suggest new methods for detecting morphological errors. Our fast-pass approach provided many algorithmic challenges, including the design and implementation of novel shallow convolutional neural nets and the parallelization of watershed and object-merging techniques. We use it to reconstruct, from image stack to skeletons, the full dataset of Kasthuri et al. (463 GB capturing 120,000 cubic microns) in a matter of hours on a single multicore machine rather than the weeks it has taken in the past on much larger distributed systems.
研究の動機と目的
- 現代の電子顕微鏡が生み出すペタバイトスケールのEMデータセットが、既存のパイプラインの処理能力を超える、接続ゲノミクス分野のビッグデータボトルネックに対処すること。
- 共有メモリ型マルチコアシステム上で効率的に動作する、リアルタイムでスケーラブルな大規模ニューロン形態再構成ソリューションを構築すること。
- 計算時間の大幅な短縮を実現しながら、最先端の手法と同等のセグメンテーション精度を達成し、アルゴリズムの迅速な反復とテストを可能にすること。
- 高速で近似的なセグメンテーションと、計算コストの高い誤り訂正を分離するマルチパスフレームワークを導入し、リソースの最適化を図ること。
提案手法
- EM画像スタックからの膜確率予測に、新規の浅い畳み込みニューラルネットワークを用いた高速パスパイプラインを実装する。
- ウォーターシェッドベースの過剰セグメンテーションに続き、マルチコア最適化された凝集(NeuroProof)を適用して初期ニューロンセグメンテーションを生成する。
- 高確率誤り領域としてマークされた領域のみを再セグメンテーションするスパースなスローパスアプローチを用い、計算リソースを必要な場所に集中させる。
- ランダムに選択されたボリュームパッチに二項ノイズを適用してトレーニングした独自のCNNアーキテクチャを用いた、マスク拡張(MaskExtend)という機械学習ベースの手法を開発し、断たれた軸索セグメントをスライス間で延長する。
- 生物学的に不自然なX字接合部を、特に細いまたは複雑なニューロンプロセスにおいて結合誤りとして特定する形態的誤り検出システムを設計する。
- 隣接する画像スライス間でのブロック間マージを適用し、スライス間のセグメンテーションずれを是正し、空間的一致性を確保する。
実験結果
リサーチクエスチョン
- RQ11台の共有メモリ型マルチコアシステム上で、マルチパスセグメンテーションパイプラインが大規模なEMデータセットをほぼリアルタイムで処理できるか?
- RQ2計算リソースをどのように効率的に割り当てすれば、処理時間を最小限に抑えつつ高いセグメンテーション精度を維持できるか?
- RQ3機械学習ベースの誤り訂正は、従来の手法と比較して、軸索の分裂や結合アーチファクトといった形態的誤りをより効果的に検出し修正できるか?
- RQ4全データセットの再処理を伴わずに、高速パスによる初期セグメンテーションを、局所的なスローパスの精錬によって修正できる範囲はどの程度か?
主な発見
- 高速パスパイプラインは、1台のマルチコアマシン上でKasthuriデータセット(463 GB、約100,000 µm³)をわずか5時間で処理した。これは従来の分散システムと比較して90%の処理時間短縮である。
- AC3-256テストセット(3nm解像度)において、VI(情報量のばらつき)スコアが1.66を達成し、同ベンチマークで前回の最高スコア1.99を上回った。
- スローパス訂正フレームワークは、MaskExtend CNNを用いて断たれたセグメントを延長することで、100本以上の軸索および数百の軸索終末(包括してen passant終末を含む)を正常に再構成した。
- 計算リソースを高誤差領域に限定することで、全再処理の必要性を低減し、計算リソースの効率的利用を実現した。
- 処理スループットがほぼテラバイト/時間に達し、マルチビームEM顕微鏡のデータ取得速度と一致した。
- 本手法は、100,000 µm³のS1皮質ボリュームを完全に自動再構成した初の例であり、大規模神経回路マッピングにおける「オンデマンド接続ゲノミクス」の実現可能性を示した。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。