PatientGuard

Das Projekt erforscht, wie und mit welcher Qualität mittels LLM-basierter Methoden relevante Informationen aus klinischen Dokumenten extrahiert werden können zur Vorhersage und Prävention von Spitalinfektionen.

Fiche signalétique

  • Département responsable Technique et informatique
  • Institut(s) Institute for Patient-centered Digital Health (PCDH)
  • Unité(s) de recherche PCDH / AI for Health
  • Organisation d'encouragement Innosuisse
  • Durée (prévue) 04.11.2024 - 03.11.2025
  • Responsable du projet Prof. Dr. Kerstin Denecke
  • Direction du projet Prof. Dr. Kerstin Denecke
  • Équipe du projet Daniel Reichenpfader
  • Partenaire MedNota GmbH
  • Mots-clés Künstliche Intelligenz, Large Language Model, Informationsextraktion

Situation

Spitalinfektionen stellen weltweit eine grosse Herausforderung für die Gesundheitssysteme dar. Sie schaden den Patient:innen, erhöhen die Gesundheitskosten und verlängern die Krankenhausaufenthalte. 5,9 % der Patient:innen in der Schweiz leiden an einer Spitalinfektion. Bis zu 50% dieser Fälle können durch gezielte Massnahmen verhindert werden. Das Bundesamt für Gesundheit (BAG) will deshalb die Bevölkerung wirksamer schützen, d.h. die Zahl der Infektionen und die damit verbundenen Langzeitfolgen und Todesfälle reduzieren. Spitalinfektionen lassen sich durch die Analyse von Daten aus der elektronischen Patientenakte erkennen oder vorhersagen. In Spitälern wird jedoch eine beträchtliche Menge infektionsbezogener Daten in unstrukturierten Formaten gespeichert, z. B. in PDF-Berichten (z. B. Operationsberichte, Laborergebnisse) oder klinischen Notizen (handschriftlich oder elektronisch). Diese Dokumente enthalten wertvolle Erkenntnisse, aber die manuelle Extraktion der relevanten Informationen ist zeitaufwändig und führt oft dazu, dass Infektionsrisiken übersehen werden. Wir wollen Open Source anwenden Large Language Models (LLMs) wie Llama 3.2 einsetzen, um diese unstrukturierten Daten zu verarbeiten, zu analysieren und aus diesen unstrukturierten Datenquellen aussagekräftige Informationen über Spitalinfektionen zur Vorhersage und Prävention extrahieren.

Approche

Spitalinfektionen stellen weltweit eine grosse Herausforderung für die Gesundheitssysteme dar. Sie schaden den Patient*innen, erhöhen die Gesundheitskosten und verlängern die Krankenhausaufenthalte. 5,9 % der Patient*innen in der Schweiz leiden an einer Spitalinfektion. Bis zu 50% dieser Fälle können durch gezielte Massnahmen verhindert werden. Das Bundesamt für Gesundheit (BAG) will deshalb die Bevölkerung wirksamer schützen, d.h. die Zahl der Infektionen und die damit verbundenen Langzeitfolgen und Todesfälle reduzieren. Spitalinfektionen lassen sich durch die Analyse von Daten aus der elektronischen Patientenakte erkennen oder vorhersagen. In Spitälern wird jedoch eine beträchtliche Menge infektionsbezogener Daten in unstrukturierten Formaten gespeichert, z. B. in PDF-Berichten (z. B. Operationsberichte, Laborergebnisse) oder klinischen Notizen (handschriftlich oder elektronisch). Diese Dokumente enthalten wertvolle Erkenntnisse, aber die manuelle Extraktion der relevanten Informationen ist zeitaufwändig und führt oft dazu, dass Infektionsrisiken übersehen werden. Wir wollen Open Source anwenden Large Language Models (LLMs) wie Llama 3.2 einsetzen, um diese unstrukturierten Daten zu verarbeiten, zu analysieren und aus diesen unstrukturierten Datenquellen aussagekräftige Informationen über Spitalinfektionen zur Vorhersage und Prävention extrahieren.

Résultat

Wir werden verschiedene LLM-basierte Methoden anwenden, vergleichen und optimieren, um relevante klinische Daten aus unstrukturierten Texten zu extrahieren, die auf Spitalinfektionen hinweisen.

Perspectives

Das Projekt liefert eine Machbarkeitsanalyse, Informationen dazu, aus welchen Dokumenten welche Indikatoren extrahiert werden können und einen Vergleich der Qualität verschiedener Large Language Models.

Ce projet contribue aux objectifs de développement durable suivants

  • 3: Accès à la santé
  • 9: Innovation et infrastructures