DataPrepHealth

post-image

Nachhaltige Datenaufbereitung mit Fokus auf Gesundheitssysteme

Das Projekt DataPrepHealth ist eine FFG-geförderte industrienahe Dissertation. Ziel der Dissertation ist die Entwicklung eines Prozesses zur nachhaltigen Datenaufbereitung mit besonderem Augenmerk auf die besonderen Anforderungen von Anwendungen im Gesundheitssystem. Die Daten sollen dabei so aufbereitet werden, dass sie im Weiteren zum Einsatz in Modellen zur Verfügung gestellt werden können.

Der Prozess der Datenaufbereitung teilt sich in mehrere Schritte:

  • Definition der Daten
  • Säuberung der Daten (Inkonsistenzen, Dupletten,…)
  • Zusammenführen von Daten aus verschiedenen Datenquellen
  • Aufbereitung und Aggregation der Daten zum Einsatz in verschiedenen Modellbildungsansätzen

Für jeden dieser Schritte sollen Methoden definiert werden, die entweder bereits vorhanden sind oder neu erstellt werden müssen. Diese Methoden sollen dann in einen einheitlichen Prozess zusammengefasst werden. Ein besonderes Augenmerk liegt dabei auf Reproduzierbarkeit, Transparenz und Dokumentierbarkeit.

Um den Prozess möglichst anwendungsnah gestalten zu können, wird er im Zuge von Anwendungsprojekten, im Besonderen aus dem Bereich des Gesundheitswesens, entwickelt. Es werden dabei die notwendigen Anforderungen festgelegt und die einzelnen Prozessschritte werden erprobt.

Das Ergebnis soll ein standardisierter Prozess sein, der in Zukunft bei vielen Projekten angewendet werden kann. Dies kann eine sehr hohe Zeitersparnis bringen, wenn nicht in jedem Projekt neu mit der Aufbereitung der Daten begonnen werden muss. Durch die hohe Transparenz und eine durchgehende Dokumentation des gesamten Prozesses ist dennoch sichergestellt, das nachvollziehbar ist, welche Schritte durchgeführt wurden und wie das Ergebnis erreicht wurde.

Förderhinweis:

Dieses Projekt ist ein durch die FFG gefördertes Forschungsprojekt.