Wer macht was im Big Data Projekt?
Wer macht was im Big Data Projekt?
Immer größere und günstigere Speicher- und Rechenkapazitäten und immer mehr verfügbare Daten in allen Lebensbereichen haben das Thema Big Data in den letzten Jahren vorangetrieben. Doch die Technik allein reicht nicht: Hinter jedem Big Data Projekt steckt immer ein Team an hochspezialisierten Experten, die die riesigen Datenmengen in konkrete Anwendungen und Nutzungsszenarien übersetzen.
Herren der Daten
Data Scientist, Data Steward, Data Architect, Data Explorer – vielfältig sind die Namen der neuen Jobtitel auf dem Arbeitsmarkt, die in den letzten Jahren entstanden sind. Mit unterschiedlichen Schwerpunkten sind die jeweiligen Experten dafür zuständig, die Aufbereitung, Anbindung und Analyse der Daten innerhalb eines Big Data Projekts zu konzipieren und umzusetzen. Sie bilden ein interdisziplinäres Projektteam, in dem Spezialisten unterschiedlicher Bereiche zusammenarbeiten. Wir haben die wichtigsten Rollen im Big Data Projekt unter die Lupe genommen.
Daten finden
Keine Datenauswertung ohne Daten – ganz klar. Data Explorer oder Data Broker haben die Aufgabe herauszufinden, wo welche Informationen verfügbar sind und welche Informationen sich für die Analyse eignen. Das betrifft natürlich die einzelnen Fachabteilungen aber auch externe Daten, zum Beispiel vom statistischen Bundesamt oder Eurostat.
Daten anbinden
Relevante Daten vorliegen zu haben, ist nur der Anfang. Data Engineers sind zuständig für die Datenversorgung und bringen die einzelnen Informationen in einer Analyseplattform zusammen. Sie setzen sich vor allem auf der technischen Seite mit Schnittstellen und Integrationen auseinander und sorgen dafür, dass die Daten für die Analyse zur Verfügung stehen.
Für Datenqualität und -sicherheit sorgen
Um auch wirklich verlässliche Analysen durchführen zu können, muss die Datenqualität stimmen. Data Manager sorgen für saubere und akkurate Informationen sowie eine ausreichende Beschreibung durch Metadaten. Einheitliche Definitionen, zum Beispiel von Zeiträumen oder anderen Kennzahlen, sind hier besonders wichtig.
Auf der anderen Seite spielt die Datensicherheit eine wichtige Rolle: Die Spezialisten in diesem Bereich beschäftigen sich mit der Frage, welche Daten für was eingesetzt werden dürfen. Auch müssen sie wissen, ob und wie zum Beispiel personenbezogene Daten noch anonymisiert werden müssen.
Daten analysieren
Der Data Scientist ist das Analyse-Experte im Big Data Team. Er weiß, mit welchen Abfragen, Algorithmen oder Data Mining Methoden sich die relevanten Informationen aus den Daten destillieren und Vorhersagen treffen lassen. Als Schnittstelle zwischen Mathematik, Informatik und Fachbereich kennt er sich in jeder dieser Domänen aus und hat zudem ein Gespür dafür, wie sich Zusammenhänge oder Insights verständlich aufbereiten lassen.
Ergebnisse nutzen und optimieren
Hier kommen die „Endanwender“ ins Spiel, sprich die Kollegen in den Fachabteilungen. Bereits bei der Konzeptionierung eines Big Data Projekts sollten diese ins Boot geholt werden. Anderenfalls kann es passieren, dass die Big Data Anwendung an den konkreten Bedürfnissen der Fachbereiche vorbei entwickelt werden. Die Fachexperten wissen, welche Informationen sie für ihre tägliche Arbeit brauchen, welche Informationen ihnen weiterhelfen und wie die Praxis abseits der Ergebnisse der Datenanalysen aussieht.
Ein Blick über den Tellerrand
In einem Big Data Projekt kommen viele Spezialisten an einen Tisch. Egal ob Fachexperten, IT-Spezialisten oder Daten-Analysten: Damit es mit der Kommunikation innerhalb eines Teams klappt, schadet es nicht, über seinen eigenen Horizont hinauszublicken und auch die Basics aus den „Nachbardomänen“ zu kennen. Grundlegende Begriffe der Datenanalyse sowie die wichtigsten Begriffe Tools wie NoSQL oder Hadoop sollten zumindest grob bekannt sein. Auf der anderen Seite ist es für die Daten-Spezialisten ratsam, der Materie des Fachbereichs aufgeschlossen gegenüber zu stehen, um besser auf deren Bedürfnisse einzugehen.