Informationsextraktion aus klinischen Dokumenten zur Registermeldung
Das Projekt zielt darauf ab, den Prozess der Datenpopulation für klinische Register durch die Anwendung grosser Sprachmodelle (LLMs) zu automatisieren.
Steckbrief
- Beteiligte Departemente Technik und Informatik
- Institut(e) Institute for Patient-centered Digital Health (PCDH)
- Forschungseinheit(en) PCDH / AI for Health
- Förderorganisation Innosuisse
- Laufzeit (geplant) 17.06.2024 - 17.06.2025
- Projektleitung Prof. Dr. Kerstin Denecke
- Partner ID Suisse AG
- Schlüsselwörter Künstliche Intelligenz, Large Language Model, Informationsextraktion
Ausgangslage
Dieses Projekt zielt darauf ab, den Prozess der Datenerfassung für klinische Register durch die Anwendung grosser Sprachmodelle (LLM) zu automatisieren. Derzeit sind 116 Register im Schweizerischen Forum der klinischen Register vertreten, das von der FMH, der Schweizerischen Ärztekammer, verwaltet wird. Registerdaten sind für die Qualitätssicherung unerlässlich (z. B. das Register für Implantate SIRIS), einschliesslich der Verfolgung von unerwünschten Ereignissen und Ergebnissen sowie der Identifizierung von Behandlungslücken. Diese und ähnliche Anwendungsfälle erfordern vollständige und qualitativ hochwertige Daten, die in Registern verfügbar sind. Herkömmliche Methoden zur Extraktion klinischer Daten aus Routinedaten und Krankenhausinformationssystemen beinhalten das manuelle Kopieren und Einfügen von Daten, ein zeitaufwändiger und fehleranfälliger Prozess, der zu inkonsistenten und unvollständigen Daten führt. Unser Ansatz zielt darauf ab, diesen Prozess zu automatisieren, indem wir fortschrittliche Algorithmen zur Verarbeitung natürlicher Sprache (Natural Language Processing, NLP) entwickeln, die in der Lage sind, relevante klinische Informationen aus unstrukturiertem Text in medizinischen Aufzeichnungen genau zu analysieren und zu extrahieren.
Vorgehen
Wir werden LLM-basierte Methoden anwenden und optimieren, um relevante klinische Daten aus unstrukturierten Texten zu extrahieren und diese in Registerformulare zu füllen. Ausserdem werden wir die Skalierbarkeit des entwickelten Systems untersuchen und daraus ableiten, welche Möglichkeiten es gibt für die weitere Entwicklung, Weiterentwicklung und Verbesserung, um den sich wandelnden Bedürfnissen des Gesundheitswesens und dem technologischen Fortschritten Rechnung zu tragen.
Ergebnisse
Ergebnis des Projekts ist eine Validierung der Durchführbarkeit und Qualitätsabschätzung von LLM-basierten Methoden zur Informationsextraktion zu Befüllung von klinischen Registern.