PPML-Health: A Privacy-Preserving Machine Learning Infrastructure for Health Research

Die entwickelte Plattform ermöglicht maschinelles Lernen auf Daten von über 400 Millionen Patient*innen, ohne dass Daten mit Patientenbezug aus ihrer geschützten Umgebung genommen werden. So können Diagnosen und Behandlung verbessert werden.

Steckbrief

Ausgangslage

Die Software-Plattform Patient Network Explorer (PNEx) des Dateninformatikunternehmens Clinerion bietet Echtzeitzugriff auf die Patientendossiers von über 400 Millionen Patient*innen weltweit. Diese Daten werden aktuell vor allem für die Planung und Optimierung von klinischen Studien verwendet, sowie auch für die Rekrutierung von Patient*innen für diese Studien. Das Potenzial der PNEx-Plattform ist dadurch aber noch nicht ausgeschöpft: Mit Hilfe von maschinellem Lernen können die Daten für weitere Analysen und selbst Prognosen verwendet werden. Allerdings eignen sich bestehende Cloud-basierte Lösungen für maschinelles Lernen aufgrund der hohen Anforderungen an den Schutz von Patientendaten nicht für den Einsatz im Gesundheitswesen.

Vorgehen

Mit dem sogenannten Federated Learning wurde deshalb innerhalb des Projektes PPML-Health ein neuer Ansatz umgesetzt. Dieser ermöglicht maschinelles Lernen, bei dem sensitive Daten in der geschützten Krankenhausumgebung bleiben. Denn beim Federated Learning werden Modelle gleichzeitig auf mehreren Geräten trainiert, ohne dass sensitive Daten ausgetauscht werden. Lediglich Modellparameter werden in regelmässigen Zeitabständen mit einem zentralen Server geteilt, der basierend darauf die Modelle mit neuen Parametern versorgt. Dabei kommen dafür die sogenannten «Federated Averaging»- und «Federated Proximity»-Algorithmen zum Einsatz.

An dem durch die Innosuisse geförderten Projekt beteiligt waren die Berner Fachhochschule, die Universität Zürich und Clinerion. Die Berner Fachhochschule war für die Entwicklung der User Interfaces und für den Aufbau der Maschine Learning Pipelines zuständig. Die Universität Zürich war für die Entwicklung der Algorithmen für das «Federated Learning » zuständig. Übergeordnet war Clinerion für die Umsetzung auf ihren IT-Systemen zuständig.

Ergebnisse

Resultat des Projekts ist die «Federated Machine Learning Platform», deren Einführung Clinerion im November 2022 offiziell bekanntgegeben hat. Durch diese Erweiterung der PNEx-Plattform können Modelle entwickelt werden, die beispielsweise die personalisierte Prognose von Behandlungsergebnissen oder die Entdeckung von Symptomclustern ermöglichen. Ersteres trägt dazu bei, dass Ärzt*innen und Versicherungsunternehmen die Wirksamkeit und Angemessenheit eines vorgeschlagenen Medikaments besser beurteilen können. Letzteres hilft Pharmaunternehmen, bei bestehenden Medikamenten neue Wirkungen und Anwendungsgebiete zu finden.

Die entwickelten Modelle und die «Federated Machine Learning Platform» wurden als Teil des Innosuisse-Projektes in mehreren Spitälern in Clinerions IT-Infrastruktur installiert. Die Installation in den restlichen Spitälern, die Teil des PNEx-Netzwerks sind, findet über die nächsten Jahre statt.

PPML-Health: A Privacy-Preserving Machine Learning Infrastructure for Health Research
Abbildung: Clinerion

Ausblick

Mehrere Kunden des Dateninformatikunternehmens Clinerion haben bereits Interesse angemeldet, mit der Plattform zu arbeiten, um Modelle zur Voraussage von «Patient Journeys» zu erstellen und um ein besseres Verständnis zu erhalten zu den massgebenden Faktoren an unterschiedlichen Stellen einer Behandlung.

Weiter besteht bei Clinerion-Kund*innen das Interesse an Modellen, die Ärzt*innen bei der Diagnose von seltenen Krankheiten unterstützen sollen, indem bei Patient*innen mit hoher Wahrscheinlichkeit einer Erkrankung ein Screening empfohlen wird.