Why rankings of biomedical image analysis competitions should be interpreted with care

Publikation: Beitrag in FachzeitschriftForschungsartikelBeigetragenBegutachtung

Beitragende

  • Lena Maier-Hein - , Deutsches Krebsforschungszentrum (DKFZ) (Autor:in)
  • Matthias Eisenmann - , Deutsches Krebsforschungszentrum (DKFZ) (Autor:in)
  • Annika Reinke - , Deutsches Krebsforschungszentrum (DKFZ) (Autor:in)
  • Sinan Onogur - , Deutsches Krebsforschungszentrum (DKFZ) (Autor:in)
  • Marko Stankovic - , Deutsches Krebsforschungszentrum (DKFZ) (Autor:in)
  • Patrick Scholz - , Deutsches Krebsforschungszentrum (DKFZ) (Autor:in)
  • Tal Arbel - , McGill University (Autor:in)
  • Hrvoje Bogunovic - , Medizinische Universität Wien (Autor:in)
  • Andrew P. Bradley - , Queensland University of Technology (Autor:in)
  • Aaron Carass - , Johns Hopkins University (Autor:in)
  • Carolin Feldmann - , Deutsches Krebsforschungszentrum (DKFZ) (Autor:in)
  • Alejandro F. Frangi - , University of Leeds (Autor:in)
  • Peter M. Full - , Deutsches Krebsforschungszentrum (DKFZ) (Autor:in)
  • Bram van Ginneken - , Radboud University Nijmegen (Autor:in)
  • Allan Hanbury - , Technische Universitat Wien, Complexity Science Hub Vienna (Autor:in)
  • Katrin Honauer - , Universität Heidelberg (Autor:in)
  • Michal Kozubek - , Masaryk University (Autor:in)
  • Bennett A. Landman - , Vanderbilt University (Autor:in)
  • Keno März - , Deutsches Krebsforschungszentrum (DKFZ) (Autor:in)
  • Oskar Maier - , Universität zu Lübeck (Autor:in)
  • Klaus Maier-Hein - , Deutsches Krebsforschungszentrum (DKFZ) (Autor:in)
  • Bjoern H. Menze - , Technische Universität München (Autor:in)
  • Henning Müller - , Haute Ecole Spécialisée de Suisse occidentale (Autor:in)
  • Peter F. Neher - , Deutsches Krebsforschungszentrum (DKFZ) (Autor:in)
  • Wiro Niessen - , Erasmus University Rotterdam (Autor:in)
  • Nasir Rajpoot - , University of Warwick (Autor:in)
  • Gregory C. Sharp - , Harvard University (Autor:in)
  • Korsuk Sirinukunwattana - , University of Oxford (Autor:in)
  • Stefanie Speidel - , Nationales Centrum für Tumorerkrankungen Dresden (Autor:in)
  • Christian Stock - , Deutsches Krebsforschungszentrum (DKFZ) (Autor:in)
  • Danail Stoyanov - , University College London (Autor:in)
  • Abdel Aziz Taha - , Research Studios Austria (Autor:in)
  • Fons van der Sommen - , Eindhoven University of Technology (Autor:in)
  • Ching Wei Wang - , National Taiwan University of Science and Technology (Autor:in)
  • Marc André Weber - , Universitätsmedizin Rostock (Autor:in)
  • Guoyan Zheng - , Universität Bern (Autor:in)
  • Pierre Jannin - , Université de Rennes 1 (Autor:in)
  • Annette Kopp-Schneider - , Deutsches Krebsforschungszentrum (DKFZ) (Autor:in)

Abstract

International challenges have become the standard for validation of biomedical image analysis methods. Given their scientific impact, it is surprising that a critical analysis of common practices related to the organization of challenges has not yet been performed. In this paper, we present a comprehensive analysis of biomedical image analysis challenges conducted up to now. We demonstrate the importance of challenges and show that the lack of quality control has critical consequences. First, reproducibility and interpretation of the results is often hampered as only a fraction of relevant information is typically provided. Second, the rank of an algorithm is generally not robust to a number of variables such as the test data used for validation, the ranking scheme applied and the observers that make the reference annotations. To overcome these problems, we recommend best practice guidelines and define open research questions to be addressed in the future.

Details

OriginalspracheEnglisch
Aufsatznummer5217
FachzeitschriftNature communications
Jahrgang9
Ausgabenummer1
PublikationsstatusVeröffentlicht - 1 Dez. 2018
Peer-Review-StatusJa

Externe IDs

PubMed 30523263
ORCID /0000-0002-4590-1908/work/163294102