Informationsextraktion aus klinischen Dokumenten zur Registermeldung
Das Projekt zielt darauf ab, den Prozess der Datenpopulation für klinische Register durch die Anwendung grosser Sprachmodelle (LLMs) zu automatisieren.
Factsheet
- Lead school School of Engineering and Computer Science
- Institute(s) Institute for Patient-centered Digital Health (PCDH)
- Research unit(s) PCDH / AI for Health
- Funding organisation Innosuisse
- Duration (planned) 17.06.2024 - 17.06.2025
- Project management Prof. Dr. Kerstin Denecke
- Head of project Prof. Dr. Kerstin Denecke
- Partner ID Suisse AG
- Keywords Künstliche Intelligenz, Large Language Model, Informationsextraktion
Situation
Dieses Projekt zielt darauf ab, den Prozess der Datenerfassung für klinische Register durch die Anwendung grosser Sprachmodelle (LLM) zu automatisieren. Derzeit sind 116 Register im Schweizerischen Forum der klinischen Register vertreten, das von der FMH, der Schweizerischen Ärztekammer, verwaltet wird. Registerdaten sind für die Qualitätssicherung unerlässlich (z. B. das Register für Implantate SIRIS), einschliesslich der Verfolgung von unerwünschten Ereignissen und Ergebnissen sowie der Identifizierung von Behandlungslücken. Diese und ähnliche Anwendungsfälle erfordern vollständige und qualitativ hochwertige Daten, die in Registern verfügbar sind. Herkömmliche Methoden zur Extraktion klinischer Daten aus Routinedaten und Krankenhausinformationssystemen beinhalten das manuelle Kopieren und Einfügen von Daten, ein zeitaufwändiger und fehleranfälliger Prozess, der zu inkonsistenten und unvollständigen Daten führt. Unser Ansatz zielt darauf ab, diesen Prozess zu automatisieren, indem wir fortschrittliche Algorithmen zur Verarbeitung natürlicher Sprache (Natural Language Processing, NLP) entwickeln, die in der Lage sind, relevante klinische Informationen aus unstrukturiertem Text in medizinischen Aufzeichnungen genau zu analysieren und zu extrahieren.
Course of action
Wir werden LLM-basierte Methoden anwenden und optimieren, um relevante klinische Daten aus unstrukturierten Texten zu extrahieren und diese in Registerformulare zu füllen. Ausserdem werden wir die Skalierbarkeit des entwickelten Systems untersuchen und daraus ableiten, welche Möglichkeiten es gibt für die weitere Entwicklung, Weiterentwicklung und Verbesserung, um den sich wandelnden Bedürfnissen des Gesundheitswesens und dem technologischen Fortschritten Rechnung zu tragen.
Result
Ergebnis des Projekts ist eine Validierung der Durchführbarkeit und Qualitätsabschätzung von LLM-basierten Methoden zur Informationsextraktion zu Befüllung von klinischen Registern.