PatientGuard
Das Projekt erforscht, wie und mit welcher Qualität mittels LLM-basierter Methoden relevante Informationen aus klinischen Dokumenten extrahiert werden können zur Vorhersage und Prävention von Spitalinfektionen.
Steckbrief
- Lead-Departement Technik und Informatik
- Institut(e) Institute for Patient-centered Digital Health (PCDH)
- Forschungseinheit(en) PCDH / AI for Health
- Förderorganisation Innosuisse
- Laufzeit (geplant) 04.11.2024 - 03.11.2025
- Projektverantwortung Prof. Dr. Kerstin Denecke
- Projektleitung Prof. Dr. Kerstin Denecke
- Projektmitarbeitende Daniel Reichenpfader
- Partner MedNota GmbH
- Schlüsselwörter Künstliche Intelligenz, Large Language Model, Informationsextraktion
Ausgangslage
Spitalinfektionen stellen weltweit eine grosse Herausforderung für die Gesundheitssysteme dar. Sie schaden den Patient:innen, erhöhen die Gesundheitskosten und verlängern die Krankenhausaufenthalte. 5,9 % der Patient:innen in der Schweiz leiden an einer Spitalinfektion. Bis zu 50% dieser Fälle können durch gezielte Massnahmen verhindert werden. Das Bundesamt für Gesundheit (BAG) will deshalb die Bevölkerung wirksamer schützen, d.h. die Zahl der Infektionen und die damit verbundenen Langzeitfolgen und Todesfälle reduzieren. Spitalinfektionen lassen sich durch die Analyse von Daten aus der elektronischen Patientenakte erkennen oder vorhersagen. In Spitälern wird jedoch eine beträchtliche Menge infektionsbezogener Daten in unstrukturierten Formaten gespeichert, z. B. in PDF-Berichten (z. B. Operationsberichte, Laborergebnisse) oder klinischen Notizen (handschriftlich oder elektronisch). Diese Dokumente enthalten wertvolle Erkenntnisse, aber die manuelle Extraktion der relevanten Informationen ist zeitaufwändig und führt oft dazu, dass Infektionsrisiken übersehen werden. Wir wollen Open Source anwenden Large Language Models (LLMs) wie Llama 3.2 einsetzen, um diese unstrukturierten Daten zu verarbeiten, zu analysieren und aus diesen unstrukturierten Datenquellen aussagekräftige Informationen über Spitalinfektionen zur Vorhersage und Prävention extrahieren.
Vorgehen
Spitalinfektionen stellen weltweit eine grosse Herausforderung für die Gesundheitssysteme dar. Sie schaden den Patient*innen, erhöhen die Gesundheitskosten und verlängern die Krankenhausaufenthalte. 5,9 % der Patient*innen in der Schweiz leiden an einer Spitalinfektion. Bis zu 50% dieser Fälle können durch gezielte Massnahmen verhindert werden. Das Bundesamt für Gesundheit (BAG) will deshalb die Bevölkerung wirksamer schützen, d.h. die Zahl der Infektionen und die damit verbundenen Langzeitfolgen und Todesfälle reduzieren. Spitalinfektionen lassen sich durch die Analyse von Daten aus der elektronischen Patientenakte erkennen oder vorhersagen. In Spitälern wird jedoch eine beträchtliche Menge infektionsbezogener Daten in unstrukturierten Formaten gespeichert, z. B. in PDF-Berichten (z. B. Operationsberichte, Laborergebnisse) oder klinischen Notizen (handschriftlich oder elektronisch). Diese Dokumente enthalten wertvolle Erkenntnisse, aber die manuelle Extraktion der relevanten Informationen ist zeitaufwändig und führt oft dazu, dass Infektionsrisiken übersehen werden. Wir wollen Open Source anwenden Large Language Models (LLMs) wie Llama 3.2 einsetzen, um diese unstrukturierten Daten zu verarbeiten, zu analysieren und aus diesen unstrukturierten Datenquellen aussagekräftige Informationen über Spitalinfektionen zur Vorhersage und Prävention extrahieren.
Ergebnisse
Wir werden verschiedene LLM-basierte Methoden anwenden, vergleichen und optimieren, um relevante klinische Daten aus unstrukturierten Texten zu extrahieren, die auf Spitalinfektionen hinweisen.
Ausblick
Das Projekt liefert eine Machbarkeitsanalyse, Informationen dazu, aus welchen Dokumenten welche Indikatoren extrahiert werden können und einen Vergleich der Qualität verschiedener Large Language Models.