SurgicaL-CD: Generating Surgical Images via Unpaired Image Translation with Latent Consistency Diffusion Models

Danush Kumar Venkatesh; Dominik Rivoir; Micha Pfeiffer; Stefanie Speidel

doi:10.1007/978-3-031-91907-7_13

SurgicaL-CD: Generating Surgical Images via Unpaired Image Translation with Latent Consistency Diffusion Models

Publikation: Beitrag in Buch/Konferenzbericht/Sammelband/Gutachten › Beitrag in Konferenzband › Beigetragen › Begutachtung

Beitragende

Danush Kumar Venkatesh - , Nationales Centrum für Tumorerkrankungen Dresden, Universitätsklinikum Carl Gustav Carus Dresden (Autor:in)
Dominik Rivoir - , Nationales Centrum für Tumorerkrankungen Dresden, Exzellenzcluster CeTI: Zentrum für Taktiles Internet, Universitätsklinikum Carl Gustav Carus Dresden (Autor:in)
Micha Pfeiffer - , Nationales Centrum für Tumorerkrankungen Dresden, Universitätsklinikum Carl Gustav Carus Dresden (Autor:in)
Stefanie Speidel - , Exzellenzcluster CeTI: Zentrum für Taktiles Internet, Nationales Centrum für Tumorerkrankungen Dresden, Universitätsklinikum Carl Gustav Carus Dresden (Autor:in)

Abstract

Computer-assisted surgery (CAS) systems are designed to assist surgeons during procedures, thereby reducing complications and enhancing patient care. Training machine learning models for these systems requires a large corpus of annotated datasets, which is challenging to obtain in the surgical domain due to patient privacy concerns and the significant labeling effort required from doctors. Previous methods have explored unpaired image translation using generative models to create realistic surgical images from simulations. However, these approaches have struggled to produce high-quality, diverse surgical images. In this work, we introduce SurgicaL-CD, a consistency-distilled diffusion method to generate realistic surgical images with only a few sampling steps without paired data. We evaluate our approach on three datasets, assessing the generated images in terms of quality and utility as downstream training datasets. Our results demonstrate that our method outperforms GANs and diffusion-based approaches. Our code is available at https://gitlab.com/nct_tso_public/gan2diffusion.

Details

Originalsprache	Englisch
Titel	Computer Vision – ECCV 2024 Workshops
Redakteure/-innen	Alessio Del Bue, Cristian Canton, Jordi Pont-Tuset, Tatiana Tommasi
Herausgeber (Verlag)	Springer Science and Business Media B.V.
Seiten	218-235
Seitenumfang	18
ISBN (elektronisch)	978-3-031-91907-7
ISBN (Print)	978-3-031-91906-0
Publikationsstatus	Elektronische Veröffentlichung vor Drucklegung - Mai 2025
Peer-Review-Status	Ja

Publikationsreihe

Reihe	Lecture Notes in Computer Science
Band	15642 LNCS
ISSN	0302-9743

Konferenz

Titel	18th European Conference on Computer Vision
Kurztitel	ECCV 2024
Veranstaltungsnummer	18
Dauer	29 September - 4 Oktober 2024
Webseite	https://eccv.ecva.net/virtual/2024
Ort	MiCo Milano
Stadt	Milan
Land	Italien

Externe IDs

ORCID	/0000-0002-4590-1908/work/192583275

Schlagworte

ASJC Scopus Sachgebiete

Schlagwörter

Diffusion models, Surgical image generation, Unpaired image translation

Forschungsportal der TU Dresden