[論文レビュー] A scoping review of using Large Language Models (LLMs) to investigate Electronic Health Records (EHRs)
このスコーピングレビューは OpenAlex から 329 件の論文を分析し、Large Language Models が電子カルテ(EHR)をどのように研究に活用しているかをマッピングし、応用を七つのトピックに分類し、実務的含意と倫理について論じる。
Electronic Health Records (EHRs) play an important role in the healthcare system. However, their complexity and vast volume pose significant challenges to data interpretation and analysis. Recent advancements in Artificial Intelligence (AI), particularly the development of Large Language Models (LLMs), open up new opportunities for researchers in this domain. Although prior studies have demonstrated their potential in language understanding and processing in the context of EHRs, a comprehensive scoping review is lacking. This study aims to bridge this research gap by conducting a scoping review based on 329 related papers collected from OpenAlex. We first performed a bibliometric analysis to examine paper trends, model applications, and collaboration networks. Next, we manually reviewed and categorized each paper into one of the seven identified topics: named entity recognition, information extraction, text similarity, text summarization, text classification, dialogue system, and diagnosis and prediction. For each topic, we discussed the unique capabilities of LLMs, such as their ability to understand context, capture semantic relations, and generate human-like text. Finally, we highlighted several implications for researchers from the perspectives of data resources, prompt engineering, fine-tuning, performance measures, and ethical concerns. In conclusion, this study provides valuable insights into the potential of LLMs to transform EHR research and discusses their applications and ethical considerations.
研究の動機と目的
- EHRs の複雑さに対処し、LLMs が解釈と分析の支援にどう役立つかを理解する必要性を扱い、研究を動機づける。
- EHRs に適用された LLMs の既存文献を包括的にマッピングする。
- 主要なアプリケーション・トピックを特定し、それぞれのトピック内での LLMs の能力を要約する。
- データ資源、プロンプト設計、ファインチューニング、パフォーマンス指標、倫理を含む研究者への方法論的・倫理的配慮を強調する。
提案手法
- OpenAlex から収集した 329 件の関連論文について、文献計量分析を実施する。
- 各論文を手動で七つのトピックに分類する:Named Entity Recognition、Information Extraction、Text Similarity、Text Summarization、Text Classification、Dialogue System、Diagnosis and Prediction。
- LLMs のトピック別能力(文脈理解、意味関係、人間らしいテキスト生成)を論じる。
- データ資源、プロンプト設計、ファインチューニング、パフォーマンス指標、倫理に関する研究者への含意を強調する。
実験結果
リサーチクエスチョン
- RQ1LLMs は EHR 研究でどのトピックに対処しているか(例:NER、情報抽出、テキスト要約 など)?
- RQ2これらの特定トピックで LLMs は EHR でどのように性能を発揮し、どのように振る舞うのか?
- RQ3データ資源、 prompting 戦略、ファインチューニングアプローチ、パフォーマンス指標、倫理的考慮が LLM の EHR 研究での利用をどう形作るか?
主な発見
- OpenAlex から 329 件の関連論文を収集。
- 論文は手動で七つのトピック:Named Entity Recognition、Information Extraction、Text Similarity、Text Summarization、Text Classification、Dialogue System、Diagnosis and Prediction に分類。
- 文献計量分析を実施し、論文の動向、モデルの適用、協力ネットワークを検討。
- 研究は LLMs のトピック別能力、例えば文脈理解、意味関係の把握、人間のようなテキスト生成などを論じる。
- 研究者への含意には、データ資源、プロンプト設計、ファインチューニング、パフォーマンス指標、倫理的懸念の考慮が含まれる。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。