Prospective multicenter study using artificial intelligence to improve dermoscopic melanoma diagnosis in patient care

Publikation: Beitrag in FachzeitschriftForschungsartikelBeigetragenBegutachtung

Beitragende

  • Lukas Heinlein - , Deutsches Krebsforschungszentrum (DKFZ) (Autor:in)
  • Roman C Maron - , Deutsches Krebsforschungszentrum (DKFZ) (Autor:in)
  • Achim Hekler - , Deutsches Krebsforschungszentrum (DKFZ) (Autor:in)
  • Sarah Haggenmüller - , Deutsches Krebsforschungszentrum (DKFZ) (Autor:in)
  • Christoph Wies - , Universität Heidelberg (Autor:in)
  • Jochen S Utikal - , DKFZ-Hector Krebsinstitut an der Universitätsmedizin Mannheim (Autor:in)
  • Friedegund Meier - , Klinik und Poliklinik für Dermatologie, Hauttumorzentrum (Autor:in)
  • Sarah Hobelsberger - , Klinik und Poliklinik für Dermatologie (Autor:in)
  • Frank F Gellrich - , Klinik und Poliklinik für Dermatologie (Autor:in)
  • Mildred Sergon - , Klinik und Poliklinik für Dermatologie (Autor:in)
  • Axel Hauschild - , Universitätsklinikum Schleswig-Holstein Campus Kiel (Autor:in)
  • Lars E French - , Klinikum der Ludwig-Maximilians-Universität (LMU) München (Autor:in)
  • Lucie Heinzerling - , Universitätsklinikum der Friedrich-Alexander-Universität Erlangen-Nürnberg (Autor:in)
  • Justin G Schlager - , Klinikum der Ludwig-Maximilians-Universität (LMU) München (Autor:in)
  • Kamran Ghoreschi - , Charité – Universitätsmedizin Berlin (Autor:in)
  • Max Schlaak - , Charité – Universitätsmedizin Berlin (Autor:in)
  • Franz J Hilke - , Charité – Universitätsmedizin Berlin (Autor:in)
  • Gabriela Poch - , Charité – Universitätsmedizin Berlin (Autor:in)
  • Sören Korsing - , Charité – Universitätsmedizin Berlin (Autor:in)
  • Carola Berking - , Universitätsklinikum der Friedrich-Alexander-Universität Erlangen-Nürnberg (Autor:in)
  • Markus V Heppt - , Universitätsklinikum der Friedrich-Alexander-Universität Erlangen-Nürnberg (Autor:in)
  • Michael Erdmann - , Universitätsklinikum der Friedrich-Alexander-Universität Erlangen-Nürnberg (Autor:in)
  • Sebastian Haferkamp - , Universitätsklinikum Regensburg (Autor:in)
  • Konstantin Drexler - , Universitätsklinikum Regensburg (Autor:in)
  • Dirk Schadendorf - , Universitätsklinikum Essen (Autor:in)
  • Wiebke Sondermann - , Universitätsklinikum Essen (Autor:in)
  • Matthias Goebeler - , Universitätsklinikum Würzburg, Nationales Zentrum für Tumorerkrankungen (NCT) WERA (Autor:in)
  • Bastian Schilling - , Universitätsklinikum Würzburg, Nationales Zentrum für Tumorerkrankungen (NCT) WERA (Autor:in)
  • Eva Krieghoff-Henning - , Deutsches Krebsforschungszentrum (DKFZ) (Autor:in)
  • Titus J Brinker - , Deutsches Krebsforschungszentrum (DKFZ) (Autor:in)

Abstract

BACKGROUND: Early detection of melanoma, a potentially lethal type of skin cancer with high prevalence worldwide, improves patient prognosis. In retrospective studies, artificial intelligence (AI) has proven to be helpful for enhancing melanoma detection. However, there are few prospective studies confirming these promising results. Existing studies are limited by low sample sizes, too homogenous datasets, or lack of inclusion of rare melanoma subtypes, preventing a fair and thorough evaluation of AI and its generalizability, a crucial aspect for its application in the clinical setting.

METHODS: Therefore, we assessed "All Data are Ext" (ADAE), an established open-source ensemble algorithm for detecting melanomas, by comparing its diagnostic accuracy to that of dermatologists on a prospectively collected, external, heterogeneous test set comprising eight distinct hospitals, four different camera setups, rare melanoma subtypes, and special anatomical sites. We advanced the algorithm with real test-time augmentation (R-TTA, i.e., providing real photographs of lesions taken from multiple angles and averaging the predictions), and evaluated its generalization capabilities.

RESULTS: Overall, the AI shows higher balanced accuracy than dermatologists (0.798, 95% confidence interval (CI) 0.779-0.814 vs. 0.781, 95% CI 0.760-0.802; p = 4.0e-145), obtaining a higher sensitivity (0.921, 95% CI 0.900-0.942 vs. 0.734, 95% CI 0.701-0.770; p = 3.3e-165) at the cost of a lower specificity (0.673, 95% CI 0.641-0.702 vs. 0.828, 95% CI 0.804-0.852; p = 3.3e-165).

CONCLUSION: As the algorithm exhibits a significant performance advantage on our heterogeneous dataset exclusively comprising melanoma-suspicious lesions, AI may offer the potential to support dermatologists, particularly in diagnosing challenging cases.

Details

OriginalspracheEnglisch
Aufsatznummer177
FachzeitschriftCommunications medicine
Jahrgang4
Ausgabenummer1
PublikationsstatusVeröffentlicht - 11 Sept. 2024
Peer-Review-StatusJa

Externe IDs

PubMedCentral PMC11387610
Scopus 85203721327
ORCID /0000-0003-4340-9706/work/168720488
ORCID /0000-0002-2164-4644/work/168720648
ORCID /0000-0001-5703-324X/work/168720699