Künstliche Intelligenz (KI) wird nicht schlau geboren, sie muss trainiert werden und das gilt auch für die KI in der Medizin. Für die meisten Anwendungen braucht es dabei nicht nur Daten, sondern viele Daten: „Es gibt nie eine Obergrenze. Je mehr, umso besser, aber Qualitätskriterien müssen erfüllt sein", sagt Prof. Sandy Engelhardt, Leiterin der AG Künstliche Intelligenz in der Kardiovaskulären Medizin am Universitätsklinikum Heidelberg, einem Standort des Deutschen Zentrums für Herz-Kreislauf-Erkrankungen (DZHK).
Ganzheitlich trainieren ist angesagt
Deutschland mit seinen mehreren Dutzend Universitätskliniken hat allerdings ein Problem. Wer zum Beispiel einen KI-Algorithmus so trainieren möchte, dass er bei defekten Aortenklappen anhand von Computertomografien (CT) Empfehlungen für die Auswahl der Ersatzklappe geben kann, der findet ein paar Hundert CT-Datensätze hier, ein paar Hundert dort. „Wenn wir nur auf unseren Heidelberger Daten trainieren würden, dann würde der Algorithmus am Ende zwar bei uns funktionieren, in anderen Krankenhäusern mit größerer Wahrscheinlichkeit eher weniger gut", so Engelhardt.
Der Grund ist, dass sich die CT-Datensätze der Krankenhäuser unterscheiden: Es gibt CT-Geräte verschiedener Hersteller. Die Bildausschnitte variieren, die Untersuchungen werden individuell parametriert. „Wenn wir einen Algorithmus haben wollen, der auf Basis von Routinedaten hilfreiche Empfehlungen geben kann, dann muss der mit Daten verschiedener Einrichtungen trainiert werden", sagt Engelhardt. Letztlich ist das wie im Fitnessstudio: Wer eine ausgewogene Körpersilhouette haben will und nicht aussehen möchte wie Popeye, der darf nicht nur Bizeps Curls machen. Er muss auch Trizeps und Latissimus trainieren, muss Bauch-, Rumpf- und Beinmuskulatur im Blick behalten.
DIE VORTEILE DES FÖDERIERTEN LERNENS SIND KLAR: DIE SENSIBLEN DATEN BLEIBEN, WO SIE SIND.
Eine Arbeitsgruppe, die in der Pandemie zueinanderfand
In Ländern, in denen es große Versorgungsnetzwerke mit vielen Krankenhäusern und gemeinsamer Datenhaltung gibt, ist ein umfassendes Training einfach umzusetzen: Der Algorithmus wird auf den gemeinsamen Servern trainiert. Dort sind die diversen „Übungen" – die Datensätze der unterschiedlichen Einrichtungen – allesamt vorhanden. Viele KI-Entwickler gehen deswegen in die USA, oder sie kaufen dort Datensätze ein. Aber wie könnte so etwas in Deutschland funktionieren?
Diese Frage hat sich die DZHK-Gruppe AI/ML gestellt, die sich im Jahr 2019 gegründet hat, maßgeblich auf Initiative von Tim Friede, Professor für Biostatistik an der Universitätsmedizin Göttingen. „Wir sind dann während der Pandemie als Gruppe zusammengewachsen, weil wir einen gemeinsamen Review-Artikel zu KI-Anwendungen in der Kardiologie geschrieben haben", so Engelhardt. Irgendwann 2020 entstand die Idee, im DZHK-Netzwerk kardiologische KI-Algorithmen zu trainieren – nicht auf einem riesigen Server, sondern in einem föderierten Netzwerk. Vorstellen kann man sich das wie ein Zirkeltraining, bei dem der Algorithmus an diversen Stationen – allerdings simultan – trainiert wird.
Erste Aufgabe: TAVI-Prothesen berechnen
Erfunden haben die DZHK-Forscher das föderierte KI-Training nicht. Aber gemessen daran, wie oft darüber gesprochen wird, gibt es bisher erstaunlich wenige Projekte. Engelhardt ist schon etwas stolz: „Wir gehören im medizinischen Bereich weltweit zu den wenigen Konsortien, die das nachhaltig geschafft haben." Die Vorteile des föderierten Lernens sind klar: Die sensiblen Daten bleiben, wo sie sind. Das ist sicherer, und die jeweilige Einrichtung behält die Datenhoheit.
Als Pilotprojekt wählte sich die DZHK-Gruppe den Transkatheter-Aortenklappenersatz (TAVI) aus, genauer die KI-basierte Empfehlung passender TAVI-Prothesen auf Basis der CT. Professor Dr. Tim Seidler, stellvertretender Leiter der Kardiologie am Campus Kerckhoff der Justus-Liebig-Universität Gießen, leitet das Unterfangen von medizinischer Seite. Mittlerweile gibt es acht aktive Standorte, die zusammen über 8.000 CT-Datensätze beisteuern. „Wir peilen bis Ende des Jahres die Zehntausend an", so Engelhardt, die ihren Doktoranden Malte Tole mit dem Projekt betraut hat.
Und der hatte Arbeit, denn das Zirkeltraining musste erstmal aufgebaut werden. Dazu brauchte jeder Standort einen Hochleistungsrechner mit sehr guter Grafikkarte. Die Herausforderung bestand darin, diese Rechner in die lokale IT-Infrastruktur am jeweiligen Standort zu integrieren. Auf diesen Knotenrechnern wurden dann die Ausgangsdaten, beispielsweise die anonymisierten CT-Daten und Basisdaten über den Patienten, abgelegt. Im Moment arbeitet das Konsortium daran, EKG-Daten zu integrieren, um die Schrittmacherabhängigkeit des Patienten nach der Operation vorhersagen zu können. „Allein für die Anbindung der Knoten haben wir bzw. hat Malte Tölle über 200 Support-Calls gemacht", so Sandy Engelhardt. Und diese Calls können bei kniffligen Problemen schon mal ziemlich lange dauern.
Mehrere Trainingsrunden sind nötig
Es hat sich gelohnt: Für ein mehrtägiges, föderiertes Training wird der Algorithmus an alle Standorte parallel geschickt und dort trainiert. Die Trainingsergebnisse – der Fachausdruck lautet „die Modellgewichte" – werden in regelmäßigen Abständen an den zentralen Netzwerkrechner geschickt und dort zusammengeführt. Im Anschluss wird ein neuer, gemeinsamer Algorithmus in den Zirkel geschickt und es wird weitertrainiert. Am Ende hat der Algorithmus das Zirkeltraining mehrfach durchlaufen und ist dann fit genug, um mit unterschiedlichen „Geräten" – sprich Datenquellen – klarzukommen. Im Falle des TAVI-Projekts kann der Algorithmus mittlerweile die Anatomie der Aortenklappenregion auf den CT-Bildern „lesen" und zum Beispiel gefährdete Strukturen markieren. Das Empfehlen geeigneter Prothesen ist einer der nächsten Schritte.
„Das Tolle ist, dass wir den Algorithmus in unserem Netzwerk auch gleich validieren können", sagt Sandy Engelhardt. „Wir können zum Beispiel einen kompletten Standort vom Training ausklammern und den Algorithmus dann mit diesen Daten im Anschluss testen." Aus Wissenschaftsperspektive ist das ein Riesengewinn: Denn für hochrangige KI-Publikationen wird eine solche Validierung mittlerweile standardmäßig verlangt.
DENKBAR WÄRE AUCH, DAS KI-NETZWERK MIT WEITEREN DIGITALEN NETZWERKEN ZU VERKNÜPFEN.
Teamwork ist das Erfolgsrezept
Es ist naheliegend, ein solches einmal etabliertes Netzwerk auch für andere klinisch relevante Fragestellungen zu nutzen – sei es im DZHK, seien es andere Deutsche Zentren der Gesundheitsforschung (DZG). Denkbar wäre auch, das KI-Netzwerk mit weiteren digitalen Netzwerken zu verknüpfen, die in der deutschen Universitätsmedizin derzeit aufgebaut werden. „Das Interesse an dem Projekt ist mittlerweile riesig. Ich glaube wirklich, dass sich das gut skalieren ließe", so Engelhardt. Dafür müssen allerdings die Rahmenbedingungen stimmen. Es braucht eine nachhaltige Finanzierung – und motivierte Wissenschaftler, denn Technik allein führt nicht zum Erfolg; ein interdisziplinärer Ansatz ist wichtig: „Wir sind deswegen so weit gekommen, weil wir extrem gut kooperieren. Das ist das, woran andere derartige Projekte häufig scheitern."
VORSTELLEN KANN MAN SICH DAS WIE EIN ZIRKELTRAINING, BEI DEM DER ALGORITHMUS AN DIVERSEN STATIONEN TRAINIERT WIRD.