PatientGuard
Das Projekt erforscht, wie und mit welcher Qualität mittels LLM-basierter Methoden relevante Informationen aus klinischen Dokumenten extrahiert werden können zur Vorhersage und Prävention von Spitalinfektionen.
Factsheet
- Lead school School of Engineering and Computer Science
- Institute(s) Institute for Patient-centered Digital Health (PCDH)
- Research unit(s) PCDH / AI for Health
- Funding organisation Innosuisse
- Duration (planned) 04.11.2024 - 03.11.2025
- Project management Prof. Dr. Kerstin Denecke
- Head of project Prof. Dr. Kerstin Denecke
- Project staff Daniel Reichenpfader
- Partner MedNota GmbH
- Keywords Künstliche Intelligenz, Large Language Model, Informationsextraktion
Situation
Spitalinfektionen stellen weltweit eine grosse Herausforderung für die Gesundheitssysteme dar. Sie schaden den Patient:innen, erhöhen die Gesundheitskosten und verlängern die Krankenhausaufenthalte. 5,9 % der Patient:innen in der Schweiz leiden an einer Spitalinfektion. Bis zu 50% dieser Fälle können durch gezielte Massnahmen verhindert werden. Das Bundesamt für Gesundheit (BAG) will deshalb die Bevölkerung wirksamer schützen, d.h. die Zahl der Infektionen und die damit verbundenen Langzeitfolgen und Todesfälle reduzieren. Spitalinfektionen lassen sich durch die Analyse von Daten aus der elektronischen Patientenakte erkennen oder vorhersagen. In Spitälern wird jedoch eine beträchtliche Menge infektionsbezogener Daten in unstrukturierten Formaten gespeichert, z. B. in PDF-Berichten (z. B. Operationsberichte, Laborergebnisse) oder klinischen Notizen (handschriftlich oder elektronisch). Diese Dokumente enthalten wertvolle Erkenntnisse, aber die manuelle Extraktion der relevanten Informationen ist zeitaufwändig und führt oft dazu, dass Infektionsrisiken übersehen werden. Wir wollen Open Source anwenden Large Language Models (LLMs) wie Llama 3.2 einsetzen, um diese unstrukturierten Daten zu verarbeiten, zu analysieren und aus diesen unstrukturierten Datenquellen aussagekräftige Informationen über Spitalinfektionen zur Vorhersage und Prävention extrahieren.
Course of action
Spitalinfektionen stellen weltweit eine grosse Herausforderung für die Gesundheitssysteme dar. Sie schaden den Patient*innen, erhöhen die Gesundheitskosten und verlängern die Krankenhausaufenthalte. 5,9 % der Patient*innen in der Schweiz leiden an einer Spitalinfektion. Bis zu 50% dieser Fälle können durch gezielte Massnahmen verhindert werden. Das Bundesamt für Gesundheit (BAG) will deshalb die Bevölkerung wirksamer schützen, d.h. die Zahl der Infektionen und die damit verbundenen Langzeitfolgen und Todesfälle reduzieren. Spitalinfektionen lassen sich durch die Analyse von Daten aus der elektronischen Patientenakte erkennen oder vorhersagen. In Spitälern wird jedoch eine beträchtliche Menge infektionsbezogener Daten in unstrukturierten Formaten gespeichert, z. B. in PDF-Berichten (z. B. Operationsberichte, Laborergebnisse) oder klinischen Notizen (handschriftlich oder elektronisch). Diese Dokumente enthalten wertvolle Erkenntnisse, aber die manuelle Extraktion der relevanten Informationen ist zeitaufwändig und führt oft dazu, dass Infektionsrisiken übersehen werden. Wir wollen Open Source anwenden Large Language Models (LLMs) wie Llama 3.2 einsetzen, um diese unstrukturierten Daten zu verarbeiten, zu analysieren und aus diesen unstrukturierten Datenquellen aussagekräftige Informationen über Spitalinfektionen zur Vorhersage und Prävention extrahieren.
Result
Wir werden verschiedene LLM-basierte Methoden anwenden, vergleichen und optimieren, um relevante klinische Daten aus unstrukturierten Texten zu extrahieren, die auf Spitalinfektionen hinweisen.
Looking ahead
Das Projekt liefert eine Machbarkeitsanalyse, Informationen dazu, aus welchen Dokumenten welche Indikatoren extrahiert werden können und einen Vergleich der Qualität verschiedener Large Language Models.