Freelancer: Data Engineer mit acht Jahren Projekterfahrung (Data / Kafka, Cloud, Python / Kotlin / Java)

Freiberufler / Selbstst�ndiger

Remote-Arbeit

Verf�gbar ab: 30.06.2026

Verf�gbar zu: 100%

davon vor Ort: 25%

Top-Skills

Data Engineering

Kafka

Datenbanken

ETL

CI/CD

Airflow

Spark Streaming

Kafka Streams

AWS

Kubernetes

Docker

Gitlab

Git

Java

Python

Kotlin

SQL

NoSQL

Apache Spark

Vertex AI

LLM

dbt

PostgreSQL

Sprachen

Deutsch

English

Franz�sisch

Einsatzorte

L�nder

Deutschland, Schweiz, �sterreich

Remote-Arbeit

m�glich

Projekte

2 Jahre 6 Monate

2023-10 - heute

Entwicklung und Architektur von Datenplattform (Kafka, GCP) und Document AI Integration

Data Lead und Engineer Kotlin Python dbt ...

Rolle

Data Lead und Engineer

Projektinhalte

F�r ein Logistikunternehmen wird eine flexible und skalierbare Datenplattform auf Basis von Kafka und GCP f�r die Anbindung und Integration einer heterogenen Datenlandschaft entwickelt. Die Daten werden mittels Kotlin-Microservices aus verschiedenen Quellen (File-Transfer via Google Cloud Storage, SFTP, Webhooks, REST-API) ausgelesen, geparst und nach Kafka geschrieben. Die Integration in Zielsysteme wie z.B. GCP AlloyDb erfolgt �ber Kafka Connect und JDBC. Mittels DBT werden die Verkn�pfung der Datenquellen sowie Transformationen nach den Business-Regeln der Stakeholder umgesetzt. Zus�tzlich wurden Konzepte zu Archivierung und Daten-Replay entworfen, um eine zuverl�ssige Datenlieferung zu gew�hrleisten. Ein weiterer wichtiger Bestandteil ist die Sicherung der Datenqualit�t mittels Monitoring und automatisierter Korrektur-Mechansimen. Schlie�lich werden umfangreiche Datenpipelines im Document Management und Intelligence entwickelt. Dokumente aus verschiedenen Quellen werden integriert, klassifiziert und zusammengef�hrt. In einem separaten Schritt erfolgt die automatisierte Daten-Extrahierung mittels DocumentAI sowie LLMs, um neue Informationen nutzbar zu machen und eine automatische Zuordnung der Dokumente mit anderen Unternehmensdaten zu erm�glichen.�

Kenntnisse

Kotlin Python dbt GCP Cloud Storage AlloyDB PostgreSQL Kubernetes Terraform CI/CD Datenqualit�t Metabase Akka Pekko Kafka Connect Kafka Kafka Streams EDI ASN X12 DocumentAI Vertex AI LLM GenAI Gemini

Kunde

Logistik-Branche

6 Monate

2023-04 - 2023-09

Automatisierung des Monitoring und Alerting f�r ETL Pipelines

Data Engineer Openshift Grafana Prometheus ...

Rolle

Data Engineer

Projektinhalte

Im Zuge der Produktivsetzung einer firmenweiten Datenplattform wurde das Monitoring und Alerting automatisiert. Dies beinhaltet das Setup einer Dashboards-As-Code Infrastruktur, in der sa?mtliche Dashboards und Alerts als Jsonnet-Code definiert und u?ber Git versioniert werden. Sa?mtliche Funktionen ko?nnen automatisiert auf alle Grafana Instanzen ausgerollt werden, wodurch fehleranfa?llige und zeitraubende manuelle Anpassungen u?ber das User Interface entfallen. Zusa?tzlich wurden Metriken fu?r die U?berwachung der ETL-Pipelines implementiert.

Grafana
Prometheus
Java
OpenShift
Grafonnet / Jsonnet fu?r die Dashboard Definition

Produkte

Grafana Prometheus

Kenntnisse

Openshift Grafana Prometheus Java Grafonnet Jsonnet

Kunde

Versicherung

6 Monate

2023-01 - 2023-06

Real-time Datenintegration mit Kafka / Versicherungswesen

Data Engineer Kafka Kafka Streams Kafka Connect ...

Rolle

Data Engineer

Projektinhalte

Daten verschiedener Quellsysteme werden von Java / Kafka Streams Microservices gelesen, angereichert und fu?r die Anforderungen der Zielsysteme angepasst. Die Daten werden mittels Kafka Connect in die Zielsysteme geladen, beispielsweise u?ber JDBC Konnektoren.

Apache Kafka (Kafka Streams, Kafka Connect)
Java, Quarkus
Red Hat OpenShift
Splunk, SignalFX�

Produkte

Kafka OpenShift Splunk SignalFX Prometheus Confluent Oracle MS SQL Server

Kenntnisse

Kafka Kafka Streams Kafka Connect Quarkus Prometheus Confluent Oracle MS SQL Server SQL Splunk Testautomatisierung

Kunde

Versicherung

1 Jahr 10 Monate

2021-02 - 2022-11

Stream Processing und Integration f�r Marketing Automation

Python Kotlin Kafka ...

Projektinhalte

Kundendaten (Vertragsdaten, Bewegungsdaten) wurden als Stream von mehreren Quellsystemen konsumiert und in ein externes Marketing Tool integriert. Nutzerpr�ferenzen wurden in Echtzeit berechnet, und erlauben dem CRM Team so die pr�zise Kundensegmentierung und personalisierte Kommunikation.

Apache Kafka (Kafka Streams)
Migration von legacy AWS Kinesis System
Apache Spark (DStreams API, Structured Streaming)
Kubernetes, kustomize
CI/CD (Gitlab CI)

Produkte

Kafka Kinesis Kubernetes

Kenntnisse

Python Kotlin Kafka Kafka Streams Kinesis CICD Kubernetes Terraform

10 Monate

2020-05 - 2021-02

ETL / Datenintegration f�r Reporting

Python Airflow Kubernetes ...

Projektinhalte

Kundendaten wurden aus mehreren Quellsystem mittels zuverl�ssiger ETL Pipelines integriert, in einem Data Lake gespeichert und aufbereitet und f�r firmeninterne Abteilungen bereitgestellt, um Reporting und Kunden-Analysen zu erm�glichen.�

Umfassende Konzepte f�r DSGVO / GDPR (L�schung, Beauskunftung)
Kubernetes / spark-on-k8s, kustomize
Airflow f�r workload scheduling
AWS cloud (S3, RDS), terraform
Pyspark
CI/CD (Gitlab CI)

Produkte

Sparkasse Kubernetes AWS

Kenntnisse

Python Airflow Kubernetes kustomize terraform AWS S3 Amazon RDS Pyspark Apache Spark Gitlab

6 Monate

2019-11 - 2020-04

Real-Time Integration von Finanz-Transaktionsdaten

Java Scala Kafka ...

Projektinhalte

Finanz-Transaktionsdaten wurden mit Apache Kafka integriert: Die Daten wurden als Events von Quellsystemen verarbeitet, beispielsweise als CDC Messages von relationalen Datenbanken). Mittels Kafka Streams Applikationen werden die Daten verarbeitet und in Zielsysteme geschrieben. Automatisierte Integration Tests �berpr�fen die Daten direkt in den Zielsystemen.

Produkte

Kafka

Kenntnisse

Java Scala Kafka Kafka Streams CDC RDBMS

Projektinhalte

Eine firmeninterne Datenanalyse Plattform wurde betrieben, um Teams die Entwicklung und den Betrieb von Analytischen Datenprodukten zu erm�glichen. Die Plattform stellt eine Abstraktionsschicht f�r verschiedene Big Data Technologien bereit auf Basis der Hortonworks Data Platform (Hadoop, YARN, Spark, Hive, Oozie).�

Architektur der Plattform, beispielsweise Data Lake Struktur, Security Konzepte, Self Service Konzepte
Entwicklung von Python tools f�r den standardisierten Zugang zu HDP Hadoop Ressourcen ( (Hadoop, Hive, Spark, Oozie, Ranger)
CI/CD mit Jenkins, SonarQube, Artifactory
Architektur und Entwicklung� von Logging Architektur auf Basis von Kafka und Splunk

10 Monate

2018-09 - 2019-06

Absatzprognose-Tool mit Machine Learning

Python Keras Jenkins ...

Projektinhalte

Eine Machine Learning Applikation wurde entwickelt, die Absatzprognosen in Abh�ngigkeit zu Preisnachl�ssen erstellt, um die Preisnachl�sse zu definieren, die den Umsatz maxisimiert. Die Vorhersage wurde mit Machine Learning Libraries (Tensorflow, Keras) und historischen Verkaufsdaten umgesetzt. Die Applikation wurde in weitere unternehmensinterne Systeme integriert.

Consulting f�r interne Mitarbeiter zu Software Engineering best practices (CI/CD, Testing, Code Analyse, Deployment Automatisierung, Development Workflows)
Apache Spark, Hive, Oozie
Keras, Python, Conda, IntelliJ, Git
Jenkins, SonarQube, Artifactory

Kenntnisse

Python Keras Jenkins SonarQube Apache Spark Hive Oozie

Aus- und Weiterbildung

Abschluss

MSc

Institution, Ort

TU Berlin

Schwerpunkt

Verteilte Systeme, Datenbanken, Software Engineering

4 Jahre

2010-10 - 2014-09

Informatik Studium

BSc, Karlsruher Institut f�r Technologie (KIT)

Abschluss

BSc

Institution, Ort

Karlsruher Institut f�r Technologie (KIT)

4 Jahre

2010-10 - 2014-09

Computer Science (Auslandsjahr)

Imperial College London

Institution, Ort

Imperial College London

Kompetenzen

Top-Skills

Data Engineering Kafka Datenbanken ETL CI/CD Airflow Spark Streaming Kafka Streams AWS Kubernetes Docker Gitlab Git Java Python Kotlin SQL NoSQL Apache Spark Vertex AI LLM dbt PostgreSQL

Programmiersprachen

Python

Java

Scala

Kotlin

Einsatzorte

L�nder

Deutschland, Schweiz, �sterreich

Remote-Arbeit

m�glich

Projekte

2 Jahre 6 Monate

2023-10 - heute

Entwicklung und Architektur von Datenplattform (Kafka, GCP) und Document AI Integration

Data Lead und Engineer Kotlin Python dbt ...

Rolle

Data Lead und Engineer

Projektinhalte

Kenntnisse

Kunde

Logistik-Branche

6 Monate

2023-04 - 2023-09

Automatisierung des Monitoring und Alerting f�r ETL Pipelines

Data Engineer Openshift Grafana Prometheus ...

Rolle

Data Engineer

Projektinhalte

Grafana
Prometheus
Java
OpenShift
Grafonnet / Jsonnet fu?r die Dashboard Definition

Produkte

Grafana Prometheus

Kenntnisse

Openshift Grafana Prometheus Java Grafonnet Jsonnet

Kunde

Versicherung

6 Monate

2023-01 - 2023-06

Real-time Datenintegration mit Kafka / Versicherungswesen

Data Engineer Kafka Kafka Streams Kafka Connect ...

Rolle

Data Engineer

Projektinhalte

Apache Kafka (Kafka Streams, Kafka Connect)
Java, Quarkus
Red Hat OpenShift
Splunk, SignalFX�

Produkte

Kafka OpenShift Splunk SignalFX Prometheus Confluent Oracle MS SQL Server

Kenntnisse

Kafka Kafka Streams Kafka Connect Quarkus Prometheus Confluent Oracle MS SQL Server SQL Splunk Testautomatisierung

Kunde

Versicherung

1 Jahr 10 Monate

2021-02 - 2022-11

Stream Processing und Integration f�r Marketing Automation

Python Kotlin Kafka ...

Projektinhalte

Apache Kafka (Kafka Streams)
Migration von legacy AWS Kinesis System
Apache Spark (DStreams API, Structured Streaming)
Kubernetes, kustomize
CI/CD (Gitlab CI)

Produkte

Kafka Kinesis Kubernetes

Kenntnisse

Python Kotlin Kafka Kafka Streams Kinesis CICD Kubernetes Terraform

10 Monate

2020-05 - 2021-02

ETL / Datenintegration f�r Reporting

Python Airflow Kubernetes ...

Projektinhalte

Umfassende Konzepte f�r DSGVO / GDPR (L�schung, Beauskunftung)
Kubernetes / spark-on-k8s, kustomize
Airflow f�r workload scheduling
AWS cloud (S3, RDS), terraform
Pyspark
CI/CD (Gitlab CI)

Produkte

Sparkasse Kubernetes AWS

Kenntnisse

Python Airflow Kubernetes kustomize terraform AWS S3 Amazon RDS Pyspark Apache Spark Gitlab

6 Monate

2019-11 - 2020-04

Real-Time Integration von Finanz-Transaktionsdaten

Java Scala Kafka ...

Projektinhalte

Produkte

Kafka

Kenntnisse

Java Scala Kafka Kafka Streams CDC RDBMS

Projektinhalte

Architektur der Plattform, beispielsweise Data Lake Struktur, Security Konzepte, Self Service Konzepte
Entwicklung von Python tools f�r den standardisierten Zugang zu HDP Hadoop Ressourcen ( (Hadoop, Hive, Spark, Oozie, Ranger)
CI/CD mit Jenkins, SonarQube, Artifactory
Architektur und Entwicklung� von Logging Architektur auf Basis von Kafka und Splunk

10 Monate

2018-09 - 2019-06

Absatzprognose-Tool mit Machine Learning

Python Keras Jenkins ...

Projektinhalte

Consulting f�r interne Mitarbeiter zu Software Engineering best practices (CI/CD, Testing, Code Analyse, Deployment Automatisierung, Development Workflows)
Apache Spark, Hive, Oozie
Keras, Python, Conda, IntelliJ, Git
Jenkins, SonarQube, Artifactory

Kenntnisse

Python Keras Jenkins SonarQube Apache Spark Hive Oozie

Aus- und Weiterbildung

Abschluss

MSc

Institution, Ort

TU Berlin

Schwerpunkt

Verteilte Systeme, Datenbanken, Software Engineering

4 Jahre

2010-10 - 2014-09

Informatik Studium

BSc, Karlsruher Institut f�r Technologie (KIT)

Abschluss

BSc

Institution, Ort

Karlsruher Institut f�r Technologie (KIT)

4 Jahre

2010-10 - 2014-09

Computer Science (Auslandsjahr)

Imperial College London

Institution, Ort

Imperial College London

Kompetenzen

Top-Skills

Data Engineering Kafka Datenbanken ETL CI/CD Airflow Spark Streaming Kafka Streams AWS Kubernetes Docker Gitlab Git Java Python Kotlin SQL NoSQL Apache Spark Vertex AI LLM dbt PostgreSQL

Programmiersprachen

Python

Java

Scala

Kotlin

Vertrauen Sie auf Randstad

Im Bereich Freelancing

Im Bereich Arbeitnehmer�berlassung / Personalvermittlung

Fragen?

Rufen Sie uns an +49 89 500316-300 oder schreiben Sie uns:

Name E-Mail-Adresse Ihre Frage

Telefonnummer Unternehmen

Ich habe die Datenschutzbestimmungen gelesen und bin damit einverstanden.

Einsatzorte

Projekte

Aus- und Weiterbildung

Kompetenzen

Top-Skills

Programmiersprachen

Einsatzorte

Projekte

Aus- und Weiterbildung

Kompetenzen

Top-Skills

Programmiersprachen

Vertrauen Sie auf Randstad

Fragen?

Rufen Sie uns an +49 89 500316-300 oder schreiben Sie uns:

Das Freelancer-Portal

Direktester geht's nicht! Ganz einfach Freelancer finden und direkt Kontakt aufnehmen.