
Lernfähige Maschinen in der dermatologischen Diagnostik
Bericht:
Reno Barth
Vielen Dank für Ihr Interesse!
Einige Inhalte sind aufgrund rechtlicher Bestimmungen nur für registrierte Nutzer bzw. medizinisches Fachpersonal zugänglich.
Sie sind bereits registriert?
Loggen Sie sich mit Ihrem Universimed-Benutzerkonto ein:
Sie sind noch nicht registriert?
Registrieren Sie sich jetzt kostenlos auf universimed.com und erhalten Sie Zugang zu allen Artikeln, bewerten Sie Inhalte und speichern Sie interessante Beiträge in Ihrem persönlichen Bereich
zum späteren Lesen. Ihre Registrierung ist für alle Unversimed-Portale gültig. (inkl. allgemeineplus.at & med-Diplom.at)
Von der Öffentlichkeit relativ unbeachtet, wurde in den 1990er-Jahren am Wiener AKH Pionierarbeit zum Einsatz der künstlichen Intelligenz in der Medizin geleistet, u.a. wurde die erste prospektive Studie durchgeführt, die die Leistungsfähigkeit von Mensch und Maschine in der Melanomdiagnostik verglich. Der Leiter dieser Arbeitsgruppe, Univ.-Prof. Dr. Harald Kittler, wurde jetzt zum Ordentlichen Professor für Dermatologie an der MedUni Wien ernannt.
Univ.-Prof. Dr. Harald Kittler, der Leiter der Früherkennungsambulanz an der Universitätsklinik für Dermatologie, Wien, und ausgewiesener Experte auf dem Gebiet des maschinellen Lernens zur Hautkrebsdiagnose sowie in der Erforschung der Zusammenarbeit zwischen Mensch und künstlicher Intelligenz (KI), hat Anfang Dezember 2024 eine Professur im Fachbereich Dermatologie übernommen. Kittler ist seit 2003 außerordentlicher Universitätsprofessor und bekleidet führende Rollen in der International Dermoscopy Society und der International Skin Imaging Collaboration (ISIC), wo er die Arbeitsgruppe Terminologie leitet. Kittler wurde 2016 für seine herausragenden Beiträge zur Dermato-Onkologie von der Österreichischen Gesellschaft für Dermatologie und Venerologie mit dem Ferdinand-von-Hebra-Preis ausgezeichnet. 2023 erhielt er den Wissenschaftspreis der Gesellschaft für eine Studie zum Thema „reinforcement learning“, die in Nature Medicine veröffentlicht wurde. Seine innovativen Lehransätze wurden mit Auszeichnungen wie dem „Best Teacher“-Preis gewürdigt.
Kittler erklärte bei seiner Antrittsvorlesung den Einsatz der KI in der dermatologischen Diagnostik
Beschäftigung mit KI bedeutete Beschäftigung mit Mathematik
Kittlers Beschäftigung mit der künstlichen Intelligenz in der Dermatologie begann in den frühen 1990er-Jahren, als das Wiener AKH gerade fertiggestellt war und sich einige Kliniken noch in der Übersiedelung befanden. Kittler: „KI bedeutete damals symbolische, also regelbasierte KI. Der Mensch stellt Regeln auf und der Computer arbeitet sie ab. In der Melanomdiagnostik musste man dem Computer erst einmal sagen, was Läsion ist und was Hintergrund. Und dann musste man Kriterien für Malignität definieren.“ Dies bedeutet im Falle der Dermatologie beispielsweise Seitenverhältnisse, Größe, Farbe etc. Das waren menschengemachte Kriterien, die dann auch noch in Zahlen formuliert werden mussten. Die Beschäftigung mit dieser Materie bedeutete für den Arzt Kittler zunächst auch eine intensive Auseinandersetzung mit Mathematik.
Die datenbasierte und lernfähige KI ging von der Entwicklung des Multi-Layer-Perzeptrons aus, eines künstlichen neuronalen Netzwerks (KNN), bestehend aus einer Eingabeschicht, einer oder mehreren verdeckten Schichten sowie einer Ausgabeschicht. Kittler: „Man gibt also die Daten in den Computer ein und bekommt am Ende eine Diagnose heraus. Diese Diagnosen sind anfangs vollkommen zufällig. Da wir dem Computer aber mitteilen, welche Diagnose richtig ist und welche nicht, kann er lernen und verbessert seine Treffsicherheit ständig.“ Das von Kittler und seiner Gruppe anfangs verwendete Multi-Layer-Perzeptron hatte nur 84 trainierbare Parameter. Bei modernen sprachbasierten Systemen geht die Zahl der trainierbaren Parameter in die Milliarden. Diese Entwicklung geht Hand in Hand mit der dramatischen Entwicklung der Rechnertechnik.
Publikation abgelehnt: „I don’t believe in black boxes“
Sehr schnell erfolgten erste Versuche, von der Theorie in die klinische Anwendung zu kommen. Eine erste in Wien durchgeführte Arbeit zur Melanomdiagnostik mittels KI war weltweit bahnbrechend, sie wurde zur Publikation bei Nature eingereicht – und abgelehnt. Einer der Reviewer begründete dies mit dem Satz: „I don’t believe in black boxes“, erzählte Kittler. Die Publikation erfolgte wenig später in einem etwas weniger prominenten Journal. Kittler: „Heute glaubt jeder an ,black boxes‘.“ Ungeachtet dieser Niederlage ging die Arbeit an der Melanomdiagnostik mittels KI weiter. Es wurden mehr Läsionen analysiert und damit wurde die Datenqualität verbessert. Darüber hinaus wurde die Frage gestellt, wie viele Parameter erforderlich sind, um zu zuverlässigen Diagnosen zu gelangen. Die überraschende Antwort war: Zu viele Parameter machen die Situation nicht besser, sondern führen zu schlechteren Vorhersagen. Eine Publikation aus den frühen 2000er-Jahren zeigte für die Melanomerkennung mittels KI brauchbare Sensitivität bei schlechter Spezifität.1 Kittler: „Die Maschine hielt jedes zweite Muttermal für ein Melanom. Das war natürlich ein Desaster.“ Hinzu kam, dass ein Methodenvergleich für das neuronale Netzwerk keine besseren Ergebnisse zeigte als für die logistische Regression.2 „Der Traktor war also nicht schlechter als der Ferrari“, so Kittler.
Die zweite Ernüchterung folgte in der Klinik. Kittler und seine Gruppe führten die erste prospektive Studie durch, die die Fähigkeiten von Mensch und Maschine in der Melanomdiagnostik verglich. Dabei ergab sich für die Maschine eine Sensitivität von nur 75% bei einer Spezifität von 84%.3 Kittler: „Das heißt, die Maschine hat unter klinischen Alltagsbedingungen ein Viertel der Melanome übersehen. Das war deutlich schlechter als die Ergebnisse im Labor.“ Im Gegensatz dazu kamen erfahrene Befunder auf eine Sensitivität von 96%. Angesichts dieser Ergebnisse beschloss Kittler, die Melanomdiagnostik mittels KI aufzugeben.
Neustart mit besseren Rechnern und großen Datenbanken
Die Wende kam rund ein Jahrzehnt später mit deutlich leistungsfähigeren Rechnern und verschachtelten neuronalen Netzwerken, die Bilderkennung anhand großer Bildersammlungen im Internet trainierten. Damit war das sogenannte Deep Learning erfunden, das keine vom Menschen vorgegebenen Parameter mehr benötigt. Kittler: „Sie brauchen nicht mehr den Hintergrund vom Vordergrund zu trennen oder zu segmentieren, die Maschine extrahiert sich das alles selbst und schafft eine Repräsentation des Bildes, um es dann zu klassifizieren.“ 2017 wurde in Nature eine Arbeit publiziert, die der 1995 abgelehnten österreichischen Studie ähnlich war.4 Nun wurde es Zeit, „wieder auf den Zug aufzuspringen“, so der Experte.
Der erste Schritt in diese Richtung bestand darin, einen großen Datensatz von dermatoskopischen Bildern für die internationale Forschung verfügbar zu machen. HAM10000 („human against machine with 10000 training images“) wurde gemeinsam mit der Universität Harvard publiziert und enthält tatsächlich mehr als 10000 Bilder für das Training künstlicher Intelligenz, die bislang mehr als 167000-mal heruntergeladen wurden. Dabei wurden nicht nur Nävus und Melanom berücksichtigt, sondern sieben unterschiedliche Typen von Hautläsionen.5 Kittler: „HAM10000 wurde ein Standard-Datensatz für die Diagnose von Hautkrebs.“
Ebenso gesammelt wurden Daten zur Qualität ärztlicher Melanomdiagnosen sowie zu deren Abschneiden im Vergleich zur KI. Auf Basis eines ausgeschriebenen Wettbewerbs gelang es, mehr als 500 Ärztinnen und Ärzte mit 129 Maschinen-Algorithmen zu vergleichen. Dabei erwiesen sich die besten Algorithmen zumindest im untersuchten artifiziellen Setting im Vergleich zu den Menschen als überlegen. Erfahrene Diagnostiker waren näher an den Ergebnissen der Maschine, konnten mit dieser allerdings nicht mithalten.6
Auch mit dem neuen Instrumentarium waren die Ergebnisse in der klinischen Praxis jedoch relativ ernüchternd. Gemeinsam mit einer kanadischen Firma wurde der beste der untersuchten Algorithmen in eine Handy-App übernommen und dieses Produkt mit menschlichen Befundern unter klinischen Alltagsbedingungen verglichen. Dabei erwies sich die Maschine nur noch als gleich gut wie diagnostisch erfahrene Ärzte und Ärztinnen. Im Vergleich zu Anfängern war sie klar überlegen. Allerdings zeigte sich auch, dass die Spezifität der Maschine geringer ist als jene, die Menschen in der Melanomdiagnostik erreichen. In der Befundung unpigmentierter Läsionen war die KI schlecht.7 Dies liege daran, so Kittler, dass die Maschinen nach wie vor in erster Linie mit Bildern pigmentierter Läsionen trainiert werden.
Kittler: „Das heißt, die Maschine hat Lücken bei seltenen Erscheinungen, die dem Datensatz widersprechen. Außerhalb ihres jeweils sehr engen Einsatzgebiets ist die KI ziemlich dumm.“ Daher benötige die KI den Menschen, konkret ausgebildete und erfahrene Ärzte und Ärztinnen. Es sei folglich eine schlechte Idee, diese Maschinen Laien in die Hand zu geben, denn dies führe zu einer hohen Zahl falsch positiver Befunde, die dann weiter abgeklärt werden müssten und daher weiter zur Überlastung des Gesundheitssystems beitrügen.
Künstliche Intelligenz als Lernhilfe für den Menschen
Als am sinnvollsten hat sich der Einsatz von KI in der Unterstützung unerfahrener Ärzte und Ärztinnen erwiesen, die damit an die Diagnosequalität erfahrener Befunder herankommen. Im Gegensatz dazu hat KI bei erfahrenen Diagnostikern wenig Einfluss auf die Diagnosen und ihre Qualität.8 Eine weitere potenzielle Anwendung liegt in der Telemedizin, wo die KI als Filterebene eingesetzt werden kann, die in einem ersten Schritt harmlose Befunde aus den großen Datenmengen herausfiltert. Die Interaktion mit der Maschine kann auch das menschliche Lernen verbessern, wie Kittler ausführte. Die Maschine verwendet sämtliche Informationen, die sie aus dem Bild extrahieren kann – auch solche, auf die Menschen für gewöhnlich nicht achten. Insofern kann der Mensch lernen, wenn er die Diagnosen der Maschine analysiert. Unter dem Schlagwort „explainable AI“ wird KI aufgefordert, nicht nur Entscheidungen zu treffen, sondern diese auch zu begründen.9 Damit soll die Zusammenarbeit von Mensch und Maschine verbessert werden, so Kittler. Auf diesem Weg wird auch die Qualität der Diagnosen besser und die involvierten Ärzte und Ärztinnen fühlen sich sicherer. Dies berge allerdings auch Gefahren, so Kittler, denn Sicherheit bedeute nicht automatisch, dass man auch richtig liege.
Ebenso kann KI statt einer Diagnose oder zusätzlich zu ihr Bilder aus der Datenbank zur Verfügung stellen, die der untersuchten Läsion am ähnlichsten sind und damit die ärztliche Entscheidung erleichtern. Ziel der Bemühungen ist letztlich eine multimodale KI, die beispielsweise auch die Entwicklung von Läsionen im zeitlichen Verlauf analysieren oder zwischen Sensitivität und Spezifität optimieren kann. Kittler: „Meine persönliche Hoffnung ist, dass wir in Europa den Regulierungswahn ein wenig zurückschrauben, damit wir im Vergleich zu den USA keinen zu großen Nachteil haben. KI muss schon reguliert werden, aber besser ist es, wenn man KI-Kompetenz schafft.“
Quelle:
Antrittsvorlesung von Univ.-Prof. Dr. Harald Kittler am 28. Februar 2025 in Wien
Literatur:
1 Ganster H et al.: IEEE Trans Med Imaging 2001; 20(3): 233-9 2 Dreiseitl S et al.: J Biomed Inform 2001; 34(1): 28-36 3 Dreiseitl S et al.: Melanoma Res 2009; 19(3): 180-4 4 Esteva A et al.: Nature 2017; 542(7639): 115-8 5 Tschandl P et al.: Sci Data 2018; 5: 180161 6 Tschandl P et al.: Lancet Oncol 2019; 20(7): 938-47 7 Menzies SW et al.: Lancet Digit Health 2023; 5(10): e679-e691 8 Tschandl P et al.: Nat Med 2020; 26(8): 1229-34 9 Chanda T et al.: Nat Commun 2024; 15(1): 524
Das könnte Sie auch interessieren:
Perianale Dermatosen
Perianale Dermatosen sind ein klinisch vielgestaltiges und herausforderndes Krankheitsbild, das sowohl dermatologische als auch proktologische Kompetenzen erfordert. Dieser Überblick ...
Komplikationen bei Hyaluronsäurefillern und die Lücke in der Notfallversorgung
In der ästhetischen Medizin haben sich Injektionen mit Hyaluronsäurefillern als Standardverfahren etabliert. Sie bergen in seltenen Fällen lebensverändernde Gefahren – insbesondere dann ...
Den Besonderheiten des kutanen Immunsystems auf der Spur
Univ.-Prof. Dr. Georg Stary ist seit 2024 ordentlicher Professor an der Medizinischen Universität Wien. Im Rahmen seiner Antrittsvorlesung gab er einen Überblick über die Meilensteine ...