[論文レビュー] A Computer-Aided Diagnosis System Using Artificial Intelligence for Proximal Femoral Fractures Enables Residents to Achieve a Diagnostic Rate Equivalent to Orthopedic Surgeons - multi-institutional joint development research.
本研究では、複数施設の前向き股関節X線を用いて、深層学習ベースの画像診断支援(CAD)システムを、大腿骨頸部骨折の診断に開発した。10,484枚の画像(骨折例5,242枚、非骨折例5,242枚)で学習させた本システムは、96.1%の正確性、95.2%の感度、96.9%の特異性、AUC 0.99を達成し、Grad-CAMにより解釈可能な診断根拠を提示した。その根拠は放射線科医の診断意思決定と一致した。
[Objective] To develop a Computer-aided diagnosis (CAD) system for plane frontal hip X-rays with a deep learning model trained on a large dataset collected at multiple centers. [Materials and Methods]. We included 5295 cases with neck fracture or trochanteric fracture who were diagnosed and treated by orthopedic surgeons using plane X-rays or computed tomography (CT) or magnetic resonance imaging (MRI) who visited each institution between April 2009 and March 2019 were enrolled. Cases in which both hips were not included in the photographing range, femoral shaft fractures, and periprosthetic fractures were excluded, and 5242 plane frontal pelvic X-rays obtained from 4,851 cases were used for machine learning. These images were divided into 5242 images including the fracture side and 5242 images without the fracture side, and a total of 10484 images were used for machine learning. A deep convolutional neural network approach was used for machine learning. Pytorch 1.3 and this http URL 1.0 were used as frameworks, and EfficientNet-B4, which is pre-trained ImageNet model, was used. In the final evaluation, accuracy, sensitivity, specificity, F-value and area under the curve (AUC) were evaluated. Gradient-weighted class activation mapping (Grad-CAM) was used to conceptualize the diagnostic basis of the CAD system. [Results] The diagnostic accuracy of the learning model was accuracy of 96. 1 %, sensitivity of 95.2 %, specificity of 96.9 %, F-value of 0.961, and AUC of 0.99. The cases who were correct for the diagnosis showed generally correct diagnostic basis using Grad-CAM. [Conclusions] The CAD system using deep learning model which we developed was able to diagnose hip fracture in the plane X-ray with the high accuracy, and it was possible to present the decision reason.
研究の動機と目的
- 通常の前後位の仙腸関節X線における大腿骨頸部骨折を検出するため、人工知能を用いた画像診断支援(CAD)システムを開発すること。
- 大規模かつ多施設にまたがるデータセットで学習された深層学習モデルを活用することで、レジidency医の診断正確性を向上させること。
- Grad-CAMを用いてモデルの診断的注目領域を可視化することで、意思決定の透明性を高めること。
- 標準的な指標を用いて、専門医の診断と比較して本システムの性能を評価すること。
- 本番臨床環境において、経験豊富な整形外科学専門医と同等の診断性能を達成できるかどうかを評価すること。
提案手法
- 特徴抽出および分類のため、ImageNetで事前学習済みのEfficientNet-B4を用い、PyTorch 1.3で訓練された深層畳み込みニューラルネットワークを採用した。
- データセットは、複数施設にまたがる4,851名の患者から得られた、骨折側5,242枚および非骨折側5,242枚のX線画像から構成され、画像欠損や特定の骨折タイプを有する症例は除外された。
- モデルの評価には、正確性、感度、特異性、F値、受信者リポーテージ特性曲線(AUC)の標準指標が用いられた。
- 勾配加重クラス活性化マッピング(Grad-CAM)を用いて、X線画像におけるモデルの予測に影響を与えた注目領域を可視化した。
- バランスの取れた10,484枚の画像データセットを用いて、全層のエンドツーエンド学習を実施し、さまざまな骨折タイプにわたる強固な一般化性能を確保した。
- データ前処理には、標準化とオーグメンテーションが含まれ、モデルの一般化性能を向上させるとともに過学習を低減した。
実験結果
リサーチクエスチョン
- RQ1深層学習ベースのCADシステムは、通常のX線における大腿骨頸部骨折を検出するにあたり、経験豊富な整形外科学専門医と同等の診断正確性を達成できるか?
- RQ2本モデルは、大規模かつ多施設にまたがる股関節X線データセットにおいて、感度、特異性、AUCの観点でどの程度の性能を示すか?
- RQ3Grad-CAMは、モデルの診断的根拠を解釈可能かつ臨床的に関連性のある形で可視化できるか、その程度はいかほどか?
- RQ4本CADシステムは、経験が浅い臨床医(例:レジidency医)においても、専門医と同等の診断性能を支援できるか?
- RQ5注目に基づく可視化技術を用いて、本モデルはX線画像における骨折関連解剖的領域を信頼性高く特定できるか?
主な発見
- CADシステムは、10,484枚の前向き股関節X線から成るテストデータセットにおいて96.1%の診断正確性を達成した。
- 本モデルは高い感度(95.2%)と特異性(96.9%)を示し、真の骨折を正しく検出する能力と、正常例を正しく特定する能力に優れた。
- 受信者リポーテージ特性曲線(AUC)は0.99に達し、骨折例と非骨折例の間の優れた識別能力を示した。
- F値は0.961であり、精度と再現率のバランスの取れた調和平均を反映していた。
- Grad-CAMによる可視化は、大腿骨頸部骨折に関連する解剖学的領域を正しく強調しており、モデルの診断根拠が臨床的根拠と一致していることを確認した。
- 本システムの性能から、本CADツールを用いることで、レジidency医が経験豊富な整形外科学専門医と同等の診断正確性に到達できる可能性が示された。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。