Skip to main content
QUICK REVIEW

[論文レビュー] Distribution-informed and wavelength-flexible data-driven photoacoustic oximetry

Janek Gröhl, Kylie Yeung|arXiv (Cornell University)|Mar 21, 2024
Photoacoustic and Ultrasonic Imaging被引用数 1
ひとこと要約

本稿では、線形アンミキシングを超える血酸素飽和度(sO₂)推定を実現するため、波長に柔軟で分布に配慮した深層学習フレームワークを提案する。長短期記憶(LSTM)ネットワークを用い、ジェンセン・シャノン発散(DJS)を用いて最適なトレーニングデータセットを予測することで、シミュレーション、フィジカルフォーム、および生体データの多様なデータセットにおいて、優れた精度と頑健性を達成した。線形アンミキシングおよび先行の学習済みスペクトルデカラーイング手法を上回る性能を示した。

ABSTRACT

SIGNIFICANCE: Photoacoustic imaging (PAI) promises to measure spatially resolved blood oxygen saturation but suffers from a lack of accurate and robust spectral unmixing methods to deliver on this promise. Accurate blood oxygenation estimation could have important clinical applications from cancer detection to quantifying inflammation. AIM: We address the inflexibility of existing data-driven methods for estimating blood oxygenation in PAI by introducing a recurrent neural network architecture. APPROACH: We created 25 simulated training dataset variations to assess neural network performance. We used a long short-term memory network to implement a wavelength-flexible network architecture and proposed the Jensen-Shannon divergence to predict the most suitable training dataset. RESULTS: The network architecture can flexibly handle the input wavelengths and outperforms linear unmixing and the previously proposed learned spectral decoloring method. Small changes in the training data significantly affect the accuracy of our method, but we find that the Jensen-Shannon divergence correlates with the estimation error and is thus suitable for predicting the most appropriate training datasets for any given application. CONCLUSIONS: A flexible data-driven network architecture combined with the Jensen-Shannon divergence to predict the best training data set provides a promising direction that might enable robust data-driven photoacoustic oximetry for clinical use cases.

研究の動機と目的

  • 既存のデータ駆動型光超音波酸素測定法の柔軟性不足と精度制限を克服すること。
  • シミュレーション、フォーム、生体データを含む多様な画像撮影状況において、頑健なsO₂推定を可能にすること。
  • 特定の用途に最も適したデータセットを予測するトレーニングデータ選択戦略を開発すること。
  • 深層学習ベースのスペクトルアンミキシングにおける一般化性能の向上と、トレーニングデータの変動への感受性の低減を図ること。

提案手法

  • 任意の入力波長に対応できるように設計された長短期記憶(LSTM)ニューラルネットワークアーキテクチャを採用し、sO₂推定における波長の柔軟性を実現した。
  • 入力スペクトルとトレーニングデータセットのスペクトル分布を比較する指標として、ジェンセン・シャノン発散(DJS)を用い、最適なデータセット選択を支援した。
  • モデルの頑健性と一般化性能を評価するために、異なる組織の幾何学的形状と機能的パrameter範囲を有する25のシミュレーテッドトレーニングデータセットを生成した。
  • 実世界への適用性を確認するため、インシリコシミュレーション、ゲルベースのフォーム(Gello)、および生体マウスおよびヒトデータを用いて評価を実施した。
  • 3次元の文脈に配慮したアプローチを用いて、ピクセル単位の手法よりも精度の高い、マルチスペクトル光超音波信号からのsO₂予測を実現した。
  • ドメイン適応の原則を統合することで、シミュレーテッドトレーニングデータの現実性を向上させ、ドメインシフトの低減を図った。

実験結果

リサーチクエスチョン

  • RQ1データ駆動型光超音波酸素測定法は、多様な画像撮影条件において高い精度を維持しつつ、波長に柔軟に適応できるか?
  • RQ2トレーニングデータセットの選択が、深層学習ベースのsO₂推定性能にどのように影響するか?
  • RQ3ジェンセン・シャノン発散(DJS)は、特定の用途に最も適したトレーニングデータセットを効果的に予測できる信頼性のある指標とみなせるか?
  • RQ4提案されたLSTMベースの手法は、線形アンミキシングおよび先行の学習済みスペクトルデカラーイング手法に比べ、精度と頑健性の面で優れているか?

主な発見

  • 提案されたLSTMベースの手法は、テストされたすべてのデータセットにおいて、線形アンミキシングおよび以前に報告された学習済みスペクトルデカラーイング手法を上回るsO₂推定精度を達成した。
  • ジェンセン・シャノン発散(DJS)は推定誤差と強い相関を示し、最適なトレーニングデータセットを効果的に予測する信頼性のある指標であることが示された。
  • トレーニングデータセットのパrameterにわずかな変動があるだけでモデル性能が顕著に変化することが明らかとなり、トレーニングデータの質の重要性が強調された。
  • 本手法は、インシリコ、フォーム、および生体データ(ヒトおよびマウス研究を含む)において一貫した性能を示し、強力な一般化可能性を示した。
  • CO₂実験では、線形アンミキシングはスペクトル圧縮とアーティファクトのためsO₂変化を低く推定していたが、深層学習手法は真値とより良好に一致した。
  • オープンソースのコードおよびデータはMITおよびCC-BY 4.0ライセンスの下で公開されており、広範な採用とさらなる開発を可能にしている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。