NoSQL-Schemaevolution und skalierbare Big Data Datenmigration

Die Deutsche Forschungsgemeinschaft (DFG) fördert das Projekt "NoSQL-Schemaevolution und skalierbare Big Data Datenmigration", an dem auch Prof. Dr. Stefanie Scherzinger beteiligt ist, die im Oktober 2018 zum Projekttreffen einlud.

Prof. Dr. Stefanie Scherzinger lud vom 24. bis 26. Oktober 2018 zum zweiten Projekttreffen für das DFG-geförderte Forschungsprojekt „NoSQL-Schemaevolution und skalierbare Big Data Datenmigration“ an die Ostbayerische Technische Hochschule Regensburg (OTH Regensburg) ein. Von der Universität Rostock nahmen apl. Prof. Dr. Meike Klettke und Mark Lukas Möller teil, von der Hochschule Darmstadt kamen Prof. Dr. Uta Störl und Andrea Hillenbrand nach Regensburg.

Gegenstand der gemeinsamen Untersuchungen sind NoSQL-Datenbanken, die seit mittlerweile über zehn Jahren als wesentliche Komponenten von Anwendungssoftware eingesetzt werden. Systeme wie MongoDB sind beliebt und weit verbreitet. Als eine Hauptmotivation für den Einsatz solcher Systeme wird oft ihre Schema-Flexibilität zitiert, also die Fähigkeit, heterogen strukturierte Daten verwalten zu können.

„Auch wenn eine Datenbank wie MongoDB selbst kein starres Schema vorschreibt, wird ein implizites Schema meist im Anwendungscode mithilfe von Objekt-Mappern verwaltet“, weiß Prof. Dr. Scherzinger aus ihrer Praxiserfahrung zu berichten. „Die Schema-Beschreibung ist somit Teil des Quellcodes und entwickelt sich gemeinsam mit dem restlichen Anwendungscode fort.“

Analyse quelloffener Software-Projekte

Das Forschungsteam widmet sich unter anderem der Frage, welche Praktiken in der Entwicklung von Datenbankanwendungen mit NoSQL-Systemen mittlerweile etabliert sind. Dazu werden quelloffene Software-Projekte auf der Plattform GitHub analysiert. „Indem wir quelloffene Software-Projekte mit ihrer ganzen Historie analysieren, können wir auch beobachten, wie sich das implizit deklarierte Schema mit dem Rest des Anwendungscodes fortentwickelt. Wir können dann ganz konkret die Historie der NoSQL-Schemaevolution nachvollziehen“, erklärt Prof. Dr. Scherzinger.

Die gewonnenen Erkenntnisse sollen unter anderem in einen realistischen Schema-Evolutionsbenchmark fließen, den das Projektteam erarbeiten will. „So ein Benchmark ist eine wichtige Entscheidungshilfe für Projektteams in der Praxis, die verschiedene Szenarien und unterstützende Werkzeuge ausprobieren wollen“, so der Hinweis von Prof. Dr. Scherzinger.

Von links: Prof. Dr. Stefanie Scherzinger, Prof. Dr. Uta Störl, Mark Lukas Möller, apl. Prof. Dr. Meike Klettke und Andrea Hillenbrand an der OTH Regensburg im Oktober 2018. Foto: Kannan Amuthameenakshiprasad
Von links: Prof. Dr. Stefanie Scherzinger, Prof. Dr. Uta Störl, Mark Lukas Möller, apl. Prof. Dr. Meike Klettke und Andrea Hillenbrand an der OTH Regensburg im Oktober 2018. Foto: Kannan Amuthameenakshiprasad