„Big Data: Es ist so weit”

Interview mit Sergey Rysev, Leiter Softwareentwicklung & Systemadministration bei GULP
Mann und Frau unterhalten sich - bunte Farben

„Big Data: Es ist so weit”

Interview mit Sergey Rysev, Leiter Softwareentwicklung & Systemadministration bei GULP

GULP bringt nicht nur Experten und Unternehmen zusammen, sondern beschäftigt auch selbst Software-Entwickler. Zu ihren Aufgaben gehören u.a. die Pflege und Weiterentwicklung der Technik hinter den Freelancer-Profilen, über 200.000 Projektanfragen pro Jahr und je tausend Job- und Projektangeboten täglich. Sergey Rysev, Leiter Softwareentwicklung & Systemadministration bei GULP, unterstützt mit seinem Team die internen Kollegen bei GULP dabei, in diesem riesigen Datenpool die richtigen Experten zu finden und passgenau mit den Unternehmen zusammen zu bringen. Für unsere Big Data Reihe baten wir ihn um eine Einschätzung zum aktuellen Entwicklungsstand und zu der Frage, was ein Big Data Spezialist mitbringen muss.

GULP: Wie schätzt du die aktuelle Entwicklung zu Big Data gerade ein?

Sergey Rysev: In den unterschiedlichsten Bereichen unseres Lebens explodieren die Datenmengen: Unzählige Sensordaten in unseren Autos, Kundentransaktionen, Kaufinformationen mit Rabattkarten, Bewegtdaten unseres Smartphones und Vieles mehr. Die Gesellschaft produziert immer mehr Daten, sodass diese mit klassischen Methoden nicht mehr ausgewertet werden können, selbst mit der besten Oracle Datenbank nicht.

Die Grundkonzepte zum Umgang von Big Data sind schon lange bekannt, doch bisher mangelte es schlichtweg an den technischen Gegebenheiten, um die Theorie in die Praxis umzusetzen. In den letzten Jahren machten Speicher- und Rechentechnologien einen gewaltigen Sprung und sind günstiger geworden, sodass sich das nun ändern wird.

Die großen IT-Unternehmen wie Google, IBM und Amazon Web Services haben hier wichtige Pionierarbeit geleistet. Sie bringen immer häufiger „Nebenprodukte“ ihrer eigenen Entwicklungen frei verfügbar auf den Markt, die Big Data immer massentauglicher machen. Beispiele sind Amazon Machine Learning, IBM Watson oder Lex von Amazon, das die Grundfunktionen von Alexa für eigene Anwendungen zur Verfügung stellt.

Ein viel zitierter Satz lautet: „Daten sind das neue Öl.“ Und das trifft es sehr genau: Die Daten sind Grundstoff für viele Anwendungen. Allerdings nutzt Rohöl selbst noch relativ wenig, es muss vor der Nutzung zum Beispiel als Treibstoff oder Kunststoff noch verarbeitet werden. Dennoch: Wer die Daten beziehungsweise das Öl besitzt, hat einen entscheidenden Vorsprung. Derjenige macht schnellere und bessere Entscheidungen im Vergleich zu denen, die sie nicht haben. Er weiß zum Beispiel besser, was Kunden beschäftigt und wo potenzielle Kunden zu finden sind.

GULP: Was ist der Unterschied zwischen einem Big Data Projekt und einem normalen IT-Projekt?

Sergey Rysev: Vor allem wenn Big Data Projekte neu aufgesetzt werden, haben sie einen stärkeren Forschungscharakter, denn es gibt noch nicht so viele bewährte Methoden und Herangehensweisen. Man weiß noch weniger als in traditionellen Projekten, was einen erwartet und wie letztendlich das Ergebnis sein wird.

Ein nicht zu vernachlässigender Punkt ist das Thema: Von wem kommen die Daten, wer ist Herr über die Daten und wie können diese kontrolliert und mit den passenden Zugriffsberechtigungen an die Projektteam-Mitglieder weitergegeben werden? Hier heißt es, nicht nur technisch passende Schnittstellen zu schaffen, sondern auch alle mit ins Boot zu holen.

GULP: Was müssen Big Data Experten mitbringen?

Sergey Rysev: Viel Erfahrung und Intuition. Sie müssen abschätzen können, ob sie aus den vorhandenen Daten wertvolle beziehungsweise relevante Informationen ziehen können. Oder, falls dem nicht so ist, wie bei der Suche nach Öl als „Geologen“ – im Fachjargon: “Data Broker”. Diese wissen, wo die interessanten Daten liegen, sowohl intern als auch extern, z.B. beim Statistischen Bundesamt, Eurostat usw. Und sie wissen, welche Daten relevant werden. Außerdem brauchen Big Data Experten einen gewissen Forschergeist mit allen dazugehörigen Eigenschaften: Neugier, Lernbereitschaft, Hartnäckigkeit und Ausdauer.

Und rein fachlich: DIE Big Data Technologie gibt es nicht, denn es gibt viele unterschiedliche Herangehensweisen, um Big Data Projekte zu realisieren. Wichtig sind hier vor allem Sprachen wie Python und R sowie noSQL-Datenbanksysteme rund um Hadoop wie Cassandra, HBase oder MongoDB. Auch mit Werkzeugen für SQL-Abfragen auf Hadoop-Clustern, zum Beispiel Hive, Impala oder Phoenix, sollten sich Big Data Interessierte auseinandersetzen. (Anm. d. Redaktion: Auf die Skills für Big Data werden wir in einem gesonderten Artikel eingehen.)

GULP: Wie sollten Big Data Anwendungen aussehen?

Sergey Rysev: Das Tolle an Big Data: Es geht nicht mehr nur um Individuen, sondern Big Data bringt das Wissen vieler guter Köpfe zusammen. Die Anwendungen sollten daher Entscheidungshilfen bereitstellen, die mindestens so schlau sind wie der erfahrenste Mitarbeiter. Denn nur, wenn solche automatisierten Entscheidungen besser sind als die einzelner Personen, entsteht tatsächlicher Mehrwert. Besonders zentral ist auch, dass der Algorithmus der Anwendungen dazulernt und sich so immer weiter optimiert.

Das bedeutet aber nicht, dass durch Big Data keine Experten mehr gebraucht werden. Die Anwendungen sollten im Idealfall die Arbeit der Mitarbeiter erleichtern, indem sie manche Informationen vorfiltern bzw. vorschlagen. Die tatsächliche Handlungsentscheidung sollte immer noch der Mensch fällen. Denn eines fehlt selbst dem besten Algorithmus: Das Gespür für das Zwischenmenschliche und Emotionen. Und diese Aspekte haben ebenfalls noch großen Einfluss auf geschäftliche Beziehungen.

GULP: Welche organisatorischen Anforderungen entstehen durch Big Data? Was sollte in Unternehmen beachtet werden?

Sergey Rysev: Für erfolgreiche Big Data Projekte braucht es die notwendige Infrastruktur. Das bedeutet konkret, alle notwendigen Informationen zu digitalisieren und diese aus den unterschiedlichen Systemen zusammenzubringen. Data Scientists sind notwendig, um IT, mathematische Algorithmen und die Anforderungen der Fachbereiche auf einen Nenner zu bringen. Die Mitarbeiter als Endnutzer der entwickelten Anwendungen müssen diese natürlich annehmen, in ihr tägliches Arbeiten integrieren und ihr Feedback dazu geben können. Das ist das Allerwichtigste, denn nur so können die Systeme weiter lernen.

GULP: Wie schätzt du, wird sich das Thema Big Data weiter entwickeln?

Sergey Rysev: Für IT-Spezialisten heißt es: Es ist so weit. Während das Thema Big Data vor zehn Jahren vielleicht nur für IBM- oder Google-Mitarbeiter wichtig war, sollte sich inzwischen jeder mit dem Thema befassen.

Etwas globaler betrachtet: Es werden natürlich immer mehr neue Anwendungsmöglichkeiten auf den Markt kommen, auch in Bereichen weit abseits der IT. Und diese werden unsere Gesellschaft stark beeinflussen. Beispielsweise ermöglichen Angebote zur Remote-Medizin-Diagnose Menschen an entlegenen Orten ohne gute Arztinfrastruktur, ärztliche Beratung zu erhalten. Auch unsere Arbeitswelt wird sich verändern: Es wird mehr automatisiert, es werden den Mitarbeitern Entscheidungen abgenommen – so wird sich der Aufgabenbereich der Menschen verändern.

Sergey Rysev, Leiter Softwareentwicklung & Systemadministration

Sergey Rysev ist Leiter Softwareentwicklung & Systemadministration bei GULP Information Services. An der St. Petersburg State University absolvierte der gebürtige Russe den Diplom-Studiengang Mathematik mit den Schwerpunkten Wahrscheinlichkeitstheorie und mathematische Statistik. Vor seinem Einstieg bei GULP im Jahr 2013 hatte er unter anderem bei Ravensburger Digital und Payback leitende Positionen in der Softwareentwicklung inne.