Detection of suicidality from medical text using privacy-preserving large language models

Isabella Catharina Wiest; Falk Gerrik Verhees; Dyke Ferber; JieFu Zhu; Michael Bauer; Ute Lewitzka; Andrea Pfennig; Pavol Mikolas; Jakob Nikolas Kather

doi:10.1192/bjp.2024.134

Detection of suicidality from medical text using privacy-preserving large language models

Publikation: Beitrag in Fachzeitschrift › Forschungsartikel › Beigetragen › Begutachtung

Beitragende

Isabella Catharina Wiest - , Else Kröner Fresenius Zentrum für Digitale Gesundheit, Universitätsmedizin Mannheim (Gemeinsame:r Erstautor:in)
Falk Gerrik Verhees - , Klinik und Poliklinik für Psychiatrie und Psychotherapie (Gemeinsame:r Erstautor:in)
Dyke Ferber - , Else Kröner Fresenius Zentrum für Digitale Gesundheit, Nationales Zentrum für Tumorerkrankungen (NCT) Heidelberg, Universitätsklinikum Heidelberg (Autor:in)
JieFu Zhu - , Else Kröner Fresenius Zentrum für Digitale Gesundheit (Autor:in)
Michael Bauer - , Klinik und Poliklinik für Psychiatrie und Psychotherapie (Autor:in)
Ute Lewitzka - , Klinik und Poliklinik für Psychiatrie und Psychotherapie (Autor:in)
Andrea Pfennig - , Klinik und Poliklinik für Psychiatrie und Psychotherapie (Autor:in)
Pavol Mikolas - , Klinik und Poliklinik für Psychiatrie und Psychotherapie (Gemeinsame:r Letztautor:in)
Jakob Nikolas Kather - , Else Kröner Fresenius Zentrum für Digitale Gesundheit, Medizinische Klinik und Poliklinik I, Nationales Zentrum für Tumorerkrankungen (NCT) Heidelberg, Universitätsklinikum Heidelberg (Gemeinsame:r Letztautor:in)

Abstract

Background
Attempts to use artificial intelligence (AI) in psychiatric disorders show moderate success, highlighting the potential of incorporating information from clinical assessments to improve the models. This study focuses on using large language models (LLMs) to detect suicide risk from medical text in psychiatric care.

Aims
To extract information about suicidality status from the admission notes in electronic health records (EHRs) using privacy-sensitive, locally hosted LLMs, specifically evaluating the efficacy of Llama-2 models.

Method
We compared the performance of several variants of the open source LLM Llama-2 in extracting suicidality status from 100 psychiatric reports against a ground truth defined by human experts, assessing accuracy, sensitivity, specificity and F1 score across different prompting strategies.

Results
A German fine-tuned Llama-2 model showed the highest accuracy (87.5%), sensitivity (83.0%) and specificity (91.8%) in identifying suicidality, with significant improvements in sensitivity and specificity across various prompt designs.

Conclusions
The study demonstrates the capability of LLMs, particularly Llama-2, in accurately extracting information on suicidality from psychiatric records while preserving data privacy. This suggests their application in surveillance systems for psychiatric emergencies and improving the clinical management of suicidality by improving systematic quality control and research.

Details

Originalsprache	Englisch
Seiten (von - bis)	532-537
Seitenumfang	6
Fachzeitschrift	British Journal of Psychiatry
Jahrgang	225
Ausgabenummer	6
Frühes Online-Datum	5 Nov. 2024
Publikationsstatus	Veröffentlicht - 1 Dez. 2024
Peer-Review-Status	Ja

Externe IDs

ORCID	/0000-0002-3415-5583/work/171553716
ORCID	/0000-0002-2666-859X/work/171553753
ORCID	/0000-0002-3974-7115/work/171553864
ORCID	/0000-0002-6808-2968/work/171554061
Scopus	85208752532
PubMed	39497458
ORCID	/0000-0002-3730-5348/work/198594608

Schlagworte

Ziele für nachhaltige Entwicklung

SDG 3 – Gute Gesundheit und Wohlergehen

Forschungsportal der TU Dresden

Detection of suicidality from medical text using privacy-preserving large language models

Beitragende

Abstract

Details

Externe IDs

Schlagworte

Ziele für nachhaltige Entwicklung

Verknüpfte Inhalte

Risikostratifizierung für die Anwendung von Zwangsmaßnahmen unter Verwendung künstlicher Intelligenz und elektronischer Gesundheitsdaten