PatientGuard

Das Projekt erforscht, wie und mit welcher Qualität mittels LLM-basierter Methoden relevante Informationen aus klinischen Dokumenten extrahiert werden können zur Vorhersage und Prävention von Spitalinfektionen.

Steckbrief

Beteiligte Departemente Technik und Informatik
Institut(e) Institute for Patient-centered Digital Health (PCDH)
Forschungseinheit(en) PCDH / AI for Health
Förderorganisation Innosuisse
Laufzeit (geplant) 04.11.2024 - 03.11.2025
Projektleitung Prof. Dr. Kerstin Denecke
Projektmitarbeitende Daniel Reichenpfader
Partner MedNota GmbH
Schlüsselwörter Künstliche Intelligenz, Large Language Model, Informationsextraktion

Ausgangslage

Spitalinfektionen stellen weltweit eine grosse Herausforderung für die Gesundheitssysteme dar. Sie schaden den Patient:innen, erhöhen die Gesundheitskosten und verlängern die Krankenhausaufenthalte. 5,9 % der Patient:innen in der Schweiz leiden an einer Spitalinfektion. Bis zu 50% dieser Fälle können durch gezielte Massnahmen verhindert werden. Das Bundesamt für Gesundheit (BAG) will deshalb die Bevölkerung wirksamer schützen, d.h. die Zahl der Infektionen und die damit verbundenen Langzeitfolgen und Todesfälle reduzieren. Spitalinfektionen lassen sich durch die Analyse von Daten aus der elektronischen Patientenakte erkennen oder vorhersagen. In Spitälern wird jedoch eine beträchtliche Menge infektionsbezogener Daten in unstrukturierten Formaten gespeichert, z. B. in PDF-Berichten (z. B. Operationsberichte, Laborergebnisse) oder klinischen Notizen (handschriftlich oder elektronisch). Diese Dokumente enthalten wertvolle Erkenntnisse, aber die manuelle Extraktion der relevanten Informationen ist zeitaufwändig und führt oft dazu, dass Infektionsrisiken übersehen werden. Wir wollen Open Source anwenden Large Language Models (LLMs) wie Llama 3.2 einsetzen, um diese unstrukturierten Daten zu verarbeiten, zu analysieren und aus diesen unstrukturierten Datenquellen aussagekräftige Informationen über Spitalinfektionen zur Vorhersage und Prävention extrahieren.

Vorgehen

Wir werden verschiedene LLM-basierte Methoden anwenden, vergleichen und optimieren, um relevante klinische Daten aus unstrukturierten Texten zu extrahieren, die auf Spitalinfektionen hinweisen.

Ergebnisse

Das Projekt liefert eine Machbarkeitsanalyse, Informationen dazu, aus welchen Dokumenten welche Indikatoren extrahiert werden können und einen Vergleich der Qualität verschiedener Large Language Models.