QUICK REVIEW

[論文レビュー] DeepGestalt - Identifying Rare Genetic Syndromes Using Deep Learning

Yaron Gurovich, Yair Hanani|arXiv (Cornell University)|Jan 23, 2018

Genomics and Rare Diseases参考文献 36被引用数 34

ひとこと要約

DeepGestalt は、大規模な顔認識モデルからの転移学習を活用し、26,000例以上の検証済み臨床例から構成されるキュレートされたデータベースで微調整することで、制約のない2次元顔画像から希少な遺伝性症候群を同定するディーブラーニングフレームワークである。215種類以上の症候群において91%のトップ10正答率を達成し、臨床専門家を上回る性能を示した。

ABSTRACT

Facial analysis technologies have recently measured up to the capabilities of expert clinicians in syndrome identification. To date, these technologies could only identify phenotypes of a few diseases, limiting their role in clinical settings where hundreds of diagnoses must be considered. We developed a facial analysis framework, DeepGestalt, using computer vision and deep learning algorithms, that quantifies similarities to hundreds of genetic syndromes based on unconstrained 2D images. DeepGestalt is currently trained with over 26,000 patient cases from a rapidly growing phenotype-genotype database, consisting of tens of thousands of validated clinical cases, curated through a community-driven platform. DeepGestalt currently achieves 91% top-10-accuracy in identifying over 215 different genetic syndromes and has outperformed clinical experts in three separate experiments. We suggest that this form of artificial intelligence is ready to support medical genetics in clinical and laboratory practices and will play a key role in the future of precision medicine.

研究の動機と目的

制約のない2次元顔画像から数100種の希少な遺伝性症候群を同定できるスケーラブルな顔分析システムの開発。
データ不足やモデルの一般化性能の問題により、従来のシステムが少数の症候群に限定されていたという制限を克服すること。
希少な遺伝性疾患を有する患者の診断の遅延（診断の旅）を短縮することで、臨床現場における診断スピードと正確性を向上させること。
臨床遺伝学者および専門外の医療従事者が、AI駆動の表現型分析を活用して、より迅速かつ正確に症候群を診断できるようにすること。
類似した顔貌表現型を示す未診断の症例同士をマッチング可能にする仕組みを提供することで、新規の表現型-遺伝子型相関の発見を支援すること。

提案手法

ImageNetや他のデータセットで事前学習された大規模な顔認識モデルから転移学習を実施し、一般的な顔の表現を学習する。
既知の遺伝性症候群を有する26,000例以上の検証済み患者症例から構成されるキュレートされた、コミュニティ主導のデータベースで事前学習モデルを微調整する。
顔を複数の領域（目、鼻、中面部、上部/下部顔面）に分割し、局所的な表現型特徴を捉えるために、領域別分類器を訓練する。
多数決アンサンブル戦略を用いて、領域別モデルの予測を統合することで、耐障害性と性能を向上させる。
微細な顔貌差異を示す症候群間の特徴の区別能を高めるために、メトリック学習と高度な損失関数を採用する。
ランダムベースライン性能との統計的有意性を確立するために、順列検定を用いて性能を検証する。

実験結果

リサーチクエスチョン

RQ1顔画像で学習したディーブラーニングモデルは、広範かつ不均衡な症候群セットにおいて、希少な遺伝性症候群を高い正確性で同定できるか？
RQ2領域別顔貌特徴分析を統合することで、全体顔分析に比べて、全体的な症候群分類性能が向上するか？
RQ3AIシステムは、希少または非古典的表現を示す症候群の同定において、臨床専門家を上回ることができるか？
RQ4一般顔認識データセットからの転移学習は、リソースが限られた医療表現型分類タスクにおいて、効果的な性能を発揮できるか？
RQ5多様で制約のない患者画像を含む現実的な臨床評価環境において、モデルの性能はどの程度維持されるか？

主な発見

DeepGestalt は、502枚の実臨床画像からなるテストセットにおいて、215種類以上の異なる遺伝性症候群を同定する際、91.0%のトップ10正答率を達成した。
モデルのトップ1正答率は60.0%であり、順列検定のベースライン（3.0%）を著しく上回っており（p値 = 0）、強い統計的有意性を示した。
複数の顔領域からの予測を統合したアンサンブルモデルは、83.7%のトップ5正答率を達成し、個々の領域別モデルを上回った。
領域別性能にはばらつきがあり、上部顔面（71.12%）および全体顔面（77.49%）は良好な結果を示したが、統合モデルは83.70%の正答率に達した。
3回の独立した実験において、モデルは臨床専門家を上回り、希少で複雑な症候群の診断能力に優れていることを示した。
順列検定の結果、トップ10予測の平均正答率は17.8%、標準偏差は1.55であった。これは、モデルの頑健性と信頼性を裏付けた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。