[論文レビュー] Identifying Reasons for Contraceptive Switching from Real-World Data Using Large Language Models
この研究は UCSF の臨床ノートから避妊薬変更の理由を抽出するために GPT-4 を使用し、BERT ベースラインを上回り、人間が検証した高い正確度を達成した。
Prescription contraceptives play a critical role in supporting women's reproductive health. With nearly 50 million women in the United States using contraceptives, understanding the factors that drive contraceptives selection and switching is of significant interest. However, many factors related to medication switching are often only captured in unstructured clinical notes and can be difficult to extract. Here, we evaluate the zero-shot abilities of a recently developed large language model, GPT-4 (via HIPAA-compliant Microsoft Azure API), to identify reasons for switching between classes of contraceptives from the UCSF Information Commons clinical notes dataset. We demonstrate that GPT-4 can accurately extract reasons for contraceptive switching, outperforming baseline BERT-based models with microF1 scores of 0.849 and 0.881 for contraceptive start and stop extraction, respectively. Human evaluation of GPT-4-extracted reasons for switching showed 91.4% accuracy, with minimal hallucinations. Using extracted reasons, we identified patient preference, adverse events, and insurance as key reasons for switching using unsupervised topic modeling approaches. Notably, we also showed using our approach that "weight gain/mood change" and "insurance coverage" are disproportionately found as reasons for contraceptive switching in specific demographic populations. Our code and supplemental data are available at https://github.com/BMiao10/contraceptive-switching.
研究の動機と目的
- 避妊薬の選択と切替を推進する要因の理解を動機づける。
- 非構造化臨床ノートに対する zero-shot GPT-4 の能力を評価する。
- GPT-4 の抽出性能を BERT ベースラインと比較する。
- 未監督分析を用いて switching の主要な推進要因と人口統計パターンを特定する。
提案手法
- Azure を介して HIPAA 準拠の GPT-4 を UCSF Information Commons の臨床ノートへ適用する。
- ゼロショット設定で避妊薬の開始と停止の理由を抽出する。
- microF1 スコアを用いて GPT-4 の抽出をベースライン BERT モデルと定量的に比較する。
- GPT-4 抽出理由の人間評価を実施し、正確さと幻覚を評価する。
- 非監督的トピックモデリングを用いて、主要な切替推進要因と人口統計的関連を特定する。
実験結果
リサーチクエスチョン
- RQ1GPT-4 は非構造化臨床ノートから避妊薬変更の明示的な理由を特定できるか?
- RQ2開始/停止の切替タスクにおけるゼロショット抽出で、GPT-4 はベースライン BERT モデルとどう比較されるか?
- RQ3切替の主な理由は何で、人口統計グループによって異なるか?
主な発見
- GPT-4 は抽出タスクで microF1 スコア 0.849(開始)と 0.881(停止)を達成。
- GPT-4 が抽出した理由の人間評価は 91.4% の正確性を示し、幻覚は最小限。
- 報告された理由には患者の嗜好、 有害事象、保険が主要な推進要因として挙げられる。
- 非監督トピックモデリングは、体重増加/気分変化と保険適用が特定の人口統計で切替と不均衡に関連していることを示した。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。