© Getty Images/iStockphoto

Möglichkeiten und Entwicklungen

Artificial Intelligence und Gleason Grading

Artificial Intelligence (AI) ist eine der neuen aufkommenden Technologien, die im Bereich der Medizin in den nächsten Jahren ganz sicher eine große Rolle spielen werden. Gewisse Organe sind im pathologischen Sektor wahrscheinlich leichter mit AI zu untersuchen als andere. Die Prostata bietet sich hierfür besonders an und große Forschungserfolge mit teilweiser Integration in den Routinebetrieb wurden bereits erzielt.

In den nächsten Jahren wird es trotz häufigeren Krebsdiagnosen und komplexeren Diagnosen mit Immunhistochemie oder genetischen Analysen immer weniger Pathologen geben. Deswegen ist der Ruf nach computerassistierten Lösungen laut geworden, nicht nur um die Genauigkeit der Pathologen, sondern auch um ihre Effizienz rund um die Krebsdiagnose zu verbessern.

Analyse mittels Algorithmus

IBEX Medical Analytics hat einen Algorithmus entwickelt, der es erlaubt, Prostatakarzinome präzise zu analysieren und zu befunden. Diese Lösung basiert auf AI und ist für Prostatabiopsien validiert.1 Die letzte IBEX-Studie, an der ich teilnahm, hatte zum Ziel, die Genauigkeit und Effizienz des Pathologen bei der primären Diagnose mit Prostatabiopsien zu untersuchen.

Die Analyse des Pathologen wurde verglichen mit dem Algorithmus („Galen Prostate“). Dieses AI-basierte Diagnosesystem hat mehrere Vorteile: Zuerst werden schwierige Fälle zuoberst in die Arbeitsliste aufgenommen. Der Computer analysiert dann die Prostatabiopsien und gibt seine Resultate in drei verschiedenen Kategorien – nämlich benign, borderline (unbestimmt) und Krebs – an.

Im Falle von zweifelhaften Ergebnissen verlangt der Computer automatisch eine Immunhistochemie, ohne dass der Pathologe vorher intervenieren muss. Diese Technologie erlaubt einen effizienten Workflow und bestimmt den Krebs (falls vorhanden) und das Gleason Grading mit „heatmaps“, berechnet die Länge der Biopsie und die Tumorlänge und befundet auch nicht tumorale Läsionen und Krebsvorstufen wie hochgradige prostatische intraepitheliale Neoplasien (PIN), Entzündungen oder Atrophien, die ebenfalls in einem Befund aufscheinen müssen.

Studiendesign

Das Design der Studie war folgendes: 100 konsekutive Prostatabiopsie-Fälle (785 Objektträger) wurden untersucht, die alle aus demselben französischen Labor (Medipath) stammten. Dann wurden die Resultate eines Pathologen, der nur mit dem Mikroskop arbeitete, mit denen eines Pathologen, der mit dem Galen-Prostate-Algorithmus arbeitete (Galen Prostate First Read), verglichen. Für Fälle von Uneinigkeit wurde zuvor eine „Ground Truth“ bestimmt.

Der primäre Endpunkt war, die Differenz der Ergebnisse mit dem Galen Prostate First Read und denen des Pathologen mit Mikroskop zu sehen. Sekundäre Endpunkte waren Unterschiede in der Gleason-Befundung, insbesondere Gleason 6 vs. Gleason 7.

Diskrepanzen in den Analysen

Die Resultate waren wie folgt: Die 785 Objektträger (100 konsekutive Fälle) wurden von zwei unabhängigen Pathologen begutachtet; einer arbeitete mit dem Mikroskop und einer mit dem Galen-Prostate-Algorithmus. In unklaren oder schwierigen Fällen konnte eine Immunhistochemie nachgefordert werden.

Der Vergleich der Ergebnisse zeigt: Bei insgesamt 165 Objektträgern (21%) wurden Unterschiede festgestellt, wobei bei 64 Slides Krebs bzw. ASAP (atypische mikroazinäre Proliferation) vs. gutartig fraglich war. 58 Objektträger mit Diskrepanzen zwischen Gleason 6 und Gleason 7 wurden gefunden, 30 mit einem Unterschied bezüglich der Präsenz eines Gleason Pattern 5 und 13 Objektträger mit Diskrepanzen der Tumorprozentangabe.

Ein dritter Pathologe wurde hinzugezogen, 20 Slides blieben über, um erneut digital befundet zu werden. Mit Zuhilfenahme der „Ground Truth“ konnten diese Probleme gelöst werden.

Die größten Diskrepanzen befanden sich also bei Krebs vs. benign, Gleason 6 vs. Gleason 7, der Präsenz von Gleason 5 und der Tumorprozentangabe bei Prostatabiopsien. Geringfügige Abweichungen waren in den Grade-Gruppen, in den Prozentangaben von Gleason 4 und ASAP vs. benign oder Krebs zu finden.

Bessere Performance

Bezüglich der primären Endpunkte gab es eine eindeutig bessere Performance von Pathologen, die den Galen Prostate First Read verwendeten, mit einer Zustimmungsrate von 95,16%, während die Pathologen mit dem Mikroskop eine Zustimmungsrate von 92,87% hatten, verglichen mit der „Ground Truth“. Dies zeigt, dass Pathologen mit der Galen-Prostate-First-Read-AI-Applikation besser Diagnosen erstellen können als mit einem Mikroskop.

Bezüglich der sekundären Endpunkte konnte gezeigt werden, dass Galen Prostate die Tumordetektion verbessert, mit einer Sensibilitätsrate von 99,5% für den Galen-Prostate-AI-Algorithmus alleine vs. 91,64% für den Pathologen mit dem Mikroskop und 94,91% für Pathologen mit dem Galen-Prostate-Algorithmus. Die Spezifität war 98,3% für den Galen-Algorithmus, 97,25% für den Pathologen mit Mikroskop und 97,25% für Pathologen mit dem Galen-Algorithmus.

Bezüglich des Tumor-Gradings gab es eine sehr hohe Übereinstimmung mit dem Galen-Prostate-AI-Algorithmus alleine, mit einer Sensibilität von 90,86% und einer Spezifität von 95,02%. Im Vergleich dazu ist der Pathologe mit dem Mikroskop mit 72,89% Sensibilität und 98,22% Spezifität etwas schlechter, der Pathologe mit dem Galen Prostate First Read erreicht eine Sensibilität von 74,70% und eine Spezifität von 98,87%.

Die größten Unterschiede waren bei gutartig versus Tumor, wobei dies meist sehr kleine Tumoren waren (0,5–1mm), meistens Gleason 6. Das zweite Problem waren das Grading von Gleason 9, das oft als Gleason 8 eingestuft wurde, hier muss man jedoch eine gewisse Interobserver-Variabilität mit einbeziehen, denn es gibt sowohl Low- als auch High-Grader. Die Effizienz der Diagnose wird durch Galen Prostate auf jeden Fall signifikant verbessert.

Der Pathologe mit dem Mikroskop bleibt relativ stabil mit ungefähr 10 Min. p. Diagnose, während die Learning Curve mit dem Algorithmus die Zeit von ca. 15 auf weniger als 8 Minuten verkürzt. Die mittlere Diagnosezeit beträgt für einen Pathologen mit dem Mikroskop ungefähr 1,8 Tage, während sie mit dem Galen Prostate First Read auf 9,4 Min. gesenkt werden kann. Galen Prostate verbessert also eindeutig die diagnostische Effizienz mit einer Reduktion von 27% für die Diagnose und 37%igen Verbesserung der Produktivität, wenn man sie mit einem Pathologen am Mikroskop vergleicht.

Fazit

Schlussendlich ist zu sagen, dass dies die erste wirklich große Studie war, in der ein Vergleich zwischen Pathologie und Artificial-Intelligence-basierten Lösungen ausgeführt wurde. Galen Prostate AI hilft und unterstützt Pathologen sowohl in der Genauigkeit der Befundung als auch in der Diagnose von Tumor- und sämtlichen zusätzlichen Läsionen, die in einen Befund aufgenommen werden müssen. Es gibt weniger Diskrepanz in den Biopsien gemessen mit den Pathologen, die nur ein Mikroskop verwenden, dies gilt sowohl für die Tumorbefundung als auch im Gleason Grading.

Gewisse Dinge werden schneller befundet, „high grade“ PIN und perineurale Invasionen sowie Atrophien werden ebenfalls berücksichtigt. Galen Prostate First Read zeigt eine signifikante Verbesserung der diagnostischen Effizienz bei Prostatabiopsien und auch eine kürzere Befunddauer und ist sicher langfristig eine Lösung, die für ein Pathologielabor angesichts der anfallenden Prostatabiopsien interessant sein könnte.

Viele Teams arbeiten an Verbesserungen und Ausweitungen dieses Systems, das im Idealfall auch für andere Organe verwendet werden soll/kann. Gewisse Tumoren eignen sich sicher besser, andere, wie zum Beispiel Nierenkarzinome, sind für die AI sicher ein größeres Problem.

1 Pantanowitz L et al.: An artificial intelligence algorithm for prostate cancer diagnosis in whole slide images of core needle biopsies: a blinded clinical validation and deployment study. Lancet Digit Health 2020; 2(8): 407-16

Back to top