Informationsextraktion aus klinischen Dokumenten zur Registermeldung

Das Projekt zielt darauf ab, den Prozess der Datenpopulation für klinische Register durch die Anwendung grosser Sprachmodelle (LLMs) zu automatisieren.

Fiche signalétique

  • Département responsable Technique et informatique
  • Institut(s) Institute for Patient-centered Digital Health (PCDH)
  • Unité(s) de recherche PCDH / AI for Health
  • Organisation d'encouragement Innosuisse
  • Durée (prévue) 17.06.2024 - 17.06.2025
  • Responsable du projet Prof. Dr. Kerstin Denecke
  • Direction du projet Prof. Dr. Kerstin Denecke
  • Partenaire ID Suisse AG
  • Mots-clés Künstliche Intelligenz, Large Language Model, Informationsextraktion

Situation

Dieses Projekt zielt darauf ab, den Prozess der Datenerfassung für klinische Register durch die Anwendung grosser Sprachmodelle (LLM) zu automatisieren. Derzeit sind 116 Register im Schweizerischen Forum der klinischen Register vertreten, das von der FMH, der Schweizerischen Ärztekammer, verwaltet wird. Registerdaten sind für die Qualitätssicherung unerlässlich (z. B. das Register für Implantate SIRIS), einschliesslich der Verfolgung von unerwünschten Ereignissen und Ergebnissen sowie der Identifizierung von Behandlungslücken. Diese und ähnliche Anwendungsfälle erfordern vollständige und qualitativ hochwertige Daten, die in Registern verfügbar sind. Herkömmliche Methoden zur Extraktion klinischer Daten aus Routinedaten und Krankenhausinformationssystemen beinhalten das manuelle Kopieren und Einfügen von Daten, ein zeitaufwändiger und fehleranfälliger Prozess, der zu inkonsistenten und unvollständigen Daten führt. Unser Ansatz zielt darauf ab, diesen Prozess zu automatisieren, indem wir fortschrittliche Algorithmen zur Verarbeitung natürlicher Sprache (Natural Language Processing, NLP) entwickeln, die in der Lage sind, relevante klinische Informationen aus unstrukturiertem Text in medizinischen Aufzeichnungen genau zu analysieren und zu extrahieren.

Approche

Wir werden LLM-basierte Methoden anwenden und optimieren, um relevante klinische Daten aus unstrukturierten Texten zu extrahieren und diese in Registerformulare zu füllen. Ausserdem werden wir die Skalierbarkeit des entwickelten Systems untersuchen und daraus ableiten, welche Möglichkeiten es gibt für die weitere Entwicklung, Weiterentwicklung und Verbesserung, um den sich wandelnden Bedürfnissen des Gesundheitswesens und dem technologischen Fortschritten Rechnung zu tragen.

Résultat

Ergebnis des Projekts ist eine Validierung der Durchführbarkeit und Qualitätsabschätzung von LLM-basierten Methoden zur Informationsextraktion zu Befüllung von klinischen Registern.

Ce projet contribue aux objectifs de développement durable suivants

  • 3: Accès à la santé
  • 9: Innovation et infrastructures