COVID-19: Neues Paper im Data Science Journal publiziert

  • 04.05.2021
post-image

Simulationsbasierte, anonymisierte Reproduktion detaillierter COVID-19 Fallzahlen für wissenschaftliche Community

Eine der größten Herausforderungen mit der die Wissenschaft und Forschung in der COVID-19-Pandemie zu kämpfen haben, ist der Mangel an verlässlichen und zugänglichen Daten. Die Gründe für diesen Mangel sind vielfältig und erschweren es zu gesicherten Erkenntnissen und zuverlässigen Aussagen zu gelangen - welche für die EntscheidungsträgerInnen notwendig sind.

Um dieser Herausforderung entgegenzutreten wurde von der dwh GmbH, gemeinsam mit DEXHELPP und der TU Wien, ein synthetischer Datensatz für die wissenschaftliche Forschung geschaffen. Die Arbeit und Methoden, mit denen dieser entwickelt wurde, sind nun als Paper vom renommierten Data Science Journal akzeptiert und publiziert worden.

Das Paper beschreibt, wie mithilfe unseres agentenbasierten Modells ein Datensatz erstellt wurde, der die statistische Bevölkerung auf Individuenebene abbildet. Als Basis wurden dafür historische Echtdaten verwendet.

Das Besondere dabei sind vor allem zwei Aspekte, die so erreicht werden konnten:

1. Anonymisierung

Denn das Ergebnis gleicht zwar diesen Echtdaten in der Form und der statistischen Ausprägung, stellt jedoch nur statistische Repräsentanten der Bevölkerung und keine realen Personen dar. So wird gewährleistet, dass die wissenschaftliche Community praxistaugliche Daten hat, aber keine persönlichen Informationen.

2. Zusatzinformation

Der erzeugte Datensatz ist um einige Aspekte reicher, die real gar nicht messbar sind. Die Daten enthalten zum Beispiel Informationen darüber wann und von wem eine Person infiziert wurde. Sie enthalten auch Personen, deren Infektion in der Realität gar nicht detektiert wurden (asymptomatische Fälle). Dies bietet die Möglichkeit für weitere Forschung, und auch für andere Forschende, zusätzliche Daten zur Verfügung zu stellen, welche als Realität gar nicht erfasst werden können.


N. Popper, M. Zechmeister, D. Brunmeir, C. Rippinger, N. Weibrecht, C. Urach, M. Bicher, G. Schneckenreither, A. Rauber, “Synthetic Reproduction and Augmentation of COVID-19 Case Reporting Data by Agent-Based Simulation”. Data Science Journal, 20(1), 16, 2021. doi: 10.5334/dsj-2021-016