QUICK REVIEW

[論文レビュー] EndoExtract: Co-Designing Structured Text Extraction from Endometriosis Ultrasound Reports

Haiyi Li, Yiyang Zhao|arXiv (Cornell University)|Jan 26, 2026

Radiology practices and education被引用数 0

ひとこと要約

EndoExtractは、臨床医と共同設計されたオンプレミスのLLM搭載システムで、解釈的フィールドのレビュー、証拠の自動ハイライト、バッチペースの検証を優先して、子宮内膜症の超音波レポートから構造化データを抽出します。

ABSTRACT

Endometriosis ultrasound reports are often unstructured free-text documents that require manual abstraction for downstream tasks such as analytics, machine learning model training, and clinical auditing. We present extbf{EndoExtract}, an on-premise LLM-powered system that extracts structured data from these reports and surfaces interpretive fields for human review. Through contextual inquiry with research assistants, we identified key workflow pain points: asymmetric trust between numerical and interpretive fields, repetitive manual highlighting, fatigue from sustained comparison, and terminology inconsistency across radiologists. These findings informed an interface that surfaces only interpretive fields for mandatory review, automatically highlights source evidence within PDFs, and separates batch extraction from human-paced verification. A formative workshop revealed that extbf{EndoExtract} supports a shift from field-by-field data entry to supervisory validation, though participants noted risks of over-skimming and challenges in managing missing data.

研究の動機と目的

文脈的調査を通じて子宮内膜症レポート抽象化のワークフローペインポイントを特徴づける。
臨床データレビューニーズに合わせたオンプレミスLLMベースの抽出システムを開発する。
データ入力をフィールドごとの収集から監督者による検証へ移行させるインターフェースを設計する。
自動的な証拠ハイライトと意味的正規化を有効にして検証を支援する。
ドメイン専門家を招いた形成的ワークショップを通じて導入とワークフロー影響を評価する。

提案手法

信頼の非対称性と検証実践を特定するためのリサーチアシスタントによる文脈的調査。
プライバシーを重視してオンプレミスで展開されるgpt-oss-20bバックエンドを用いたEndoExtractの開発（Ollama経由）。
必須の人間レビューとして5つの解釈的フィールドのみを開示し、150以上の数値フィールドを自動化する選択的レビュー表面。
検証を支援するためのソース証拠をPDF内で自動ハイライト。
最大5,000件のPDFをバッチ処理し、ペースを保ったレビューと変更追跡を実現。
認知負荷を低減し一貫性を高めるための用語の意味論的正規化。

実験結果

リサーチクエスチョン

RQ1ワークフロー因子と信頼の非対称性は、子宮内膜症超音波レポートからのデータ抽出にどのような影響を与えるか？
RQ2選択的レビュー表面を備えたオンプレミスLLMベースのシステムは、臨床テキスト抽象化の効率を改善しつつデータ品質を維持できるか？
RQ3証拠ハイライトとバッチペースの検証は、抽出データのより信頼性の高い監督検証を支援しますか？
RQ4臨床情報抽出における検証中心の人間-AI協働を最も支えるデザイン原則は何か？
RQ5AI支援の臨床データ抽象インターフェースの導入リスクと採用障壁はどのようなものか？

主な発見

信頼の非対称性は解釈的フィールドの選択的レビューを推進し、数値フィールドは自動化。
自動証拠ハイライトにより繰り返しの手動注釈を排除し検証を支援。
バッチ処理はペースのあるレビューを可能にし、追跡性を損なわず疲労を軽減。
意味論的正規化は用語のばらつきを減らし下流の一貫性を向上。
形成的ワークショップはデータ入力から監督検証への移行を示唆し、過剰なスキミングやデータ欠搏の潜在リスクにも留意。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。