QUICK REVIEW

[論文レビュー] PLACID: Privacy-preserving Large language models for Acronym Clinical Inference and Disambiguation

Manjushree B. Aithal, Ph. D|arXiv (Cornell University)|Mar 24, 2026

Machine Learning in Healthcare被引用数 0

ひとこと要約

PLACID は cascaded pipeline を用いたオンデバイスの privacy-preserving な略語曖昧さ解消を実現: 一般的小型モデルが略語を検出し、ドメイン特化モデルが臨床的展開を生成することで、単発の一般モデルより高い展開精度を達成。

ABSTRACT

Large Language Models (LLMs) offer transformative solutions across many domains, but healthcare integration is hindered by strict data privacy constraints. Clinical narratives are dense with ambiguous acronyms, misinterpretation these abbreviations can precipitate severe outcomes like life-threatening medication errors. While cloud-dependent LLMs excel at Acronym Disambiguation, transmitting Protected Health Information to external servers violates privacy frameworks. To bridge this gap, this study pioneers the evaluation of small-parameter models deployed entirely on-device to ensure privacy preservation. We introduce a privacy-preserving cascaded pipeline leveraging general-purpose local models to detect clinical acronyms, routing them to domain-specific biomedical models for context-relevant expansions. Results reveal that while general instruction-following models achieve high detection accuracy (~0.988), their expansion capabilities plummet (~0.655). Our cascaded approach utilizes domain-specific medical models to increase expansion accuracy to (~0.81). This novel work demonstrates that privacy-preserving, on-device (2B-10B) models deliver high-fidelity clinical acronym disambiguation support.

研究の動機と目的

臨床 Narrative における PHI を外部サーバへ送信せず privacy-preserving な略語曖昧さ解消のニーズに対処する。
オンデバイスの小型モデル（2B-10B パラメータ）で略語検出と展開を評価する。
検出を一般モデルで、展開をドメイン特化モデルで行う cascaded パイプラインを提案し、単発アプローチと比較する。
現実世界の制限付き入力シナリオを模擬するゼロショット prompting を用いつつ、オンデバイス展開を保証する。

提案手法

臨床略語曖昧さ解消の完全に局所化された LLM ベースのパイプラインを、MLX フレームワークを用いて Apple M4-Max 上で実行する。
二つの推論モードを比較する：単発推論（1つのモデルですべて検出と展開）と cascaded 推論（一般モデルで検出、ドメイン特化モデルで展開）。
厳密な JSON 出力を伴うゼロショット prompting を採用し、GLADIS 生物医療サブセットの真実値で評価する。
cascaded モードのために 4 つの一般的な指示追従小型モデル（Gemma2:2B、Llama3.2:3B、Mistral7B、Apple Foundation）と 2 つの生物医療に特化したファインチューニングモデル（MedGemma4B、BioMistral7B）を利用。
正確一致検出と BLEU/ROUGE-METEOR ベースの展開指標で性能を定量化し、原文テキストとクリーニング済みテキストの両方の前処理パイプラインを分析。

実験結果

リサーチクエスチョン

RQ1完全にオンデバイスで privacy-preserving な小型モデルが臨床テキストの略語検出と展開を正確に達成できるか。
RQ2 cascaded アプローチ（検出は一般モデル、展開はドメイン特化モデル）は臨床略語曖昧さ解消で単発アプローチより優れているか。
RQ3 ゼロショット prompting は生物医薬 domain サブセットと一般ドメインサブセットで検出と展開のパフォーマンスにどう影響するか。
RQ4 専門ドメインのファインチューニングは展開品質に対して一般目的の小型モデルと比較してどのような影響を与えるか。

主な発見

Model	Text	Det. Acc.	BLEU	METEOR	ROUGE-L
Foundation	Raw	0.988 ± 0.072	0.541	0.596	0.596
Foundation	Clean	0.988 ± 0.072	0.564	0.598	0.598
Gemma2:2b	Raw	0.930 ± 0.255	0.546	0.608	0.608
Gemma2:2b	Clean	0.930 ± 0.255	0.573	0.608	0.608
Llama3.2:3b	Raw	0.945 ± 0.229	0.535	0.588	0.588
Llama3.2:3b	Clean	0.945 ± 0.229	0.558	0.590	0.590
Mistral:7b	Raw	0.892 ± 0.311	0.600	0.655	0.655
Mistral:7b	Clean	0.892 ± 0.311	0.622	0.657	0.657

単発の一般的小型モデルは検出精度は高いが、生物医療テキストの展開品質は低い。
生物医療ドメインの評価では、ドメイン特化モデルを用いた cascaded モードで展開精度が大幅に改善される（最大約 ~0.81 まで）。
医療に特化したファインチューニングモデルは展開品質で一般モデルを上回り、 cascaded アプローチを検証可能にする。
2B-10B パラメータのオンデバイス推論は高信頼性のある privacy-preserving な略語曖昧さ解消を提供できる。
厳密な JSON 出力を伴うゼロショット prompting は臨床Narratives で安定した結果と解釈可能な展開を生む。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。