Wer macht was im Big Data Projekt?

Hinter jedem Big Data Projekt steckt immer ein Team an hochspezialisierten Experten, die die riesigen Datenmengen in konkrete Anwendungen und Nutzungsszenarien übersetzen. Wir haben die wichtigsten Rollen im Big Data Projekt unter die Lupe genommen.
Zwei Frauen am Programmieren am PC - natürliche Farben

Wer macht was im Big Data Projekt?

GULP Redaktion – Monika Riedl
Hinter jedem Big Data Projekt steckt immer ein Team an hochspezialisierten Experten, die die riesigen Datenmengen in konkrete Anwendungen und Nutzungsszenarien übersetzen. Wir haben die wichtigsten Rollen im Big Data Projekt unter die Lupe genommen.

Immer größere und günstigere Speicher- und Rechenkapazitäten und immer mehr verfügbare Daten in allen Lebensbereichen haben das Thema Big Data in den letzten Jahren vorangetrieben. Doch die Technik allein reicht nicht: Hinter jedem Big Data Projekt steckt immer ein Team an hochspezialisierten Experten, die die riesigen Datenmengen in konkrete Anwendungen und Nutzungsszenarien übersetzen.

Herren der Daten

Data Scientist, Data Steward, Data Architect, Data Explorer – vielfältig sind die Namen der neuen Jobtitel auf dem Arbeitsmarkt, die in den letzten Jahren entstanden sind. Mit unterschiedlichen Schwerpunkten sind die jeweiligen Experten dafür zuständig, die Aufbereitung, Anbindung und Analyse der Daten innerhalb eines Big Data Projekts zu konzipieren und umzusetzen. Sie bilden ein interdisziplinäres Projektteam, in dem Spezialisten unterschiedlicher Bereiche zusammenarbeiten. Wir haben die wichtigsten Rollen im Big Data Projekt unter die Lupe genommen.

Daten finden

Keine Datenauswertung ohne Daten – ganz klar. Data Explorer oder Data Broker haben die Aufgabe herauszufinden, wo welche Informationen verfügbar sind und welche Informationen sich für die Analyse eignen. Das betrifft natürlich die einzelnen Fachabteilungen aber auch externe Daten, zum Beispiel vom statistischen Bundesamt oder Eurostat.

Daten anbinden

Relevante Daten vorliegen zu haben, ist nur der Anfang. Data Engineers sind zuständig für die Datenversorgung und bringen die einzelnen Informationen in einer Analyseplattform zusammen. Sie setzen sich vor allem auf der technischen Seite mit Schnittstellen und Integrationen auseinander und sorgen dafür, dass die Daten für die Analyse zur Verfügung stehen.

Für Datenqualität und -sicherheit sorgen

Um auch wirklich verlässliche Analysen durchführen zu können, muss die Datenqualität stimmen. Data Manager sorgen für saubere und akkurate Informationen sowie eine ausreichende Beschreibung durch Metadaten. Einheitliche Definitionen, zum Beispiel von Zeiträumen oder anderen Kennzahlen, sind hier besonders wichtig.

Auf der anderen Seite spielt die Datensicherheit eine wichtige Rolle: Die Spezialisten in diesem Bereich beschäftigen sich mit der Frage, welche Daten für was eingesetzt werden dürfen. Auch müssen sie wissen, ob und wie zum Beispiel personenbezogene Daten noch anonymisiert werden müssen.

Daten analysieren

Der Data Scientist ist das Analyse-Experte im Big Data Team. Er weiß, mit welchen Abfragen, Algorithmen oder Data Mining Methoden sich die relevanten Informationen aus den Daten destillieren und Vorhersagen treffen lassen. Als Schnittstelle zwischen Mathematik, Informatik und Fachbereich kennt er sich in jeder dieser Domänen aus und hat zudem ein Gespür dafür, wie sich Zusammenhänge oder Insights verständlich aufbereiten lassen.

Ergebnisse nutzen und optimieren

Hier kommen die „Endanwender“ ins Spiel, sprich die Kollegen in den Fachabteilungen. Bereits bei der Konzeptionierung eines Big Data Projekts sollten diese ins Boot geholt werden. Anderenfalls kann es passieren, dass die Big Data Anwendung an den konkreten Bedürfnissen der Fachbereiche vorbei entwickelt werden. Die Fachexperten wissen, welche Informationen sie für ihre tägliche Arbeit brauchen, welche Informationen ihnen weiterhelfen und wie die Praxis abseits der Ergebnisse der Datenanalysen aussieht.

Ein Blick über den Tellerrand

In einem Big Data Projekt kommen viele Spezialisten an einen Tisch. Egal ob Fachexperten, IT-Spezialisten oder Daten-Analysten: Damit es mit der Kommunikation innerhalb eines Teams klappt, schadet es nicht, über seinen eigenen Horizont hinauszublicken und auch die Basics aus den „Nachbardomänen“ zu kennen. Grundlegende Begriffe der Datenanalyse sowie die wichtigsten Begriffe Tools wie NoSQL oder Hadoop sollten zumindest grob bekannt sein. Auf der anderen Seite ist es für die Daten-Spezialisten ratsam, der Materie des Fachbereichs aufgeschlossen gegenüber zu stehen, um besser auf deren Bedürfnisse einzugehen.