Freelancer: Data Pipelines unter Ber�cksichtigung von SWE und DevOps Prinzipien. Java, Scala, Python, SQL, IaC

Freiberufler / Selbstst�ndiger

Remote-Arbeit

Verf�gbar ab: 11.04.2024

Verf�gbar zu: 100%

davon vor Ort: 50%

Top-Skills

Programmierung mit Aggregationen

Stream Processing Batch Processing Kollaboration mit Data Scientisten

Sprachen

Deutsch

Englisch

Einsatzorte

L�nder

Deutschland

Remote-Arbeit

m�glich

Projekte

Projektinhalte

Zur Datenbereitstellung werden t�glich Dateien aus einem Objektspeicher in Iceberg Tabellen mittels einer cloudnativen Anwendung �berf�hrt.

Beitr�ge zum Projekt

Aufbau einer ETL-Strecke mittels Python Pandas Bibliothek und Orchestrierung �ber AWS Stepfunctions und Ausf�hrung �ber Glue-Jobs mit Python Shell und Lambdas und Infrastrukturbereitstellung �ber CDK

Kunde

TRANSPORT/LOGISTIK

Projektinhalte

Im Rahmen eines Blueprint-Projektes wurde eine Microservice-Architektur mit Micronaut und Microstream sowie gRPC als Austauschprotokoll als eine lokale Kubernetes-Applikation aufgesetzt.

Kunde

BLUEPRINT

1 Jahr 1 Monat

2022-07 - 2023-07

Datenbereitstellung f�r eine Analyseplattform

Senior Data Engineer Azure Dev Beratungsleistungen Engagement & Flexibilit�t ...

Rolle

Senior Data Engineer

Projektinhalte

Zur Datenbereitstellung aus verschiedenen Datenquellen in ein zentralisiertes Data Warehouse mit Snowflake als Analyseplattform f�r weiterf�hrendes BI-Reporting eines Flugzeugherstellers wird ein Low-Code-ETL-Tool verwendet.

Pers�nliche Beitr�ge zum Projekt

Dataintegration/Low-Coding mit ETL Tool Ab Initio.
Conceptual design zur IoT-Datenbereitstellung
Streaming job deployment zur Datenbereitstellung einer Analyseplattform
Konzept zur Schemaevolution und DataOps mit partieller Umsetzung

Kenntnisse

Azure Dev Beratungsleistungen Engagement & Flexibilit�t Git Jenkins administration Kundenorientierung Qualit�tsbewusstsein Shell / Bash Snowflake SQL Statements Stream Processing Terraform scripting

Kunde

AEROSPACE

1 Jahr 4 Monate

2022-03 - 2023-06

Tool migration data provisioning and curation analytical platform

Senior Data Engineer Analytisches Denken Azure Data Factory Beratungsleistungen ...

Rolle

Senior Data Engineer

Projektinhalte

Zur Datenbereitstellung aus verschiedenen Datenquellen f�r eine Analyseplattform f�r weiterf�hrendes BI-Reporting eines norwegischen �ffentlichen Dienstes wurde das aktuelle Data Warehouse und die damit einhergehenden Datenverarbeitungsstrecken in ein modernes Technologieumfeld migriert.

Pers�nliche Beitr�ge zum Projekt

ETL-Pipeline Migration von SSIS flows zu Azure Data Factory Dataflows mit unterliegendem Spark cluster
Dateneinspeisung und Datenverarbeitung in das bestehende Data Warehouse mit Azure SQL
Individuelles lokales Testframework in C#

Kenntnisse

Analytisches Denken Azure Data Factory Beratungsleistungen Qualit�tsbewusstsein SQL Statements C#

Kunde

PUBLIC ADMINISTRATION

Rolle

Senior Data Engineer

Projektinhalte

Implementierung einer MLOps deployment pipeline mit AWS Sagemaker zur Bilderkennung als eine Out-of-the-box-solution f�r die Bereitstellung in verschiedenen Kundenumgebungen�

�Sagemaker pipeline setup f�r Data Science unter der Verwendung einer

selbst bereit gestellten Modellimplementierung zur Bilderkennung

Sagemaker pipelinedefinition unter der Verwendung von Sagemaker Python libraries zur image runtime definition
Pipeline setup mit Modellevaluation und Modellregistrierung
Modellinference zusammen mit der Modellendpunktbereitstellung
IaC zur CI/CD stack-Bereitstellung

Pers�nliche Beitr�ge zum Projekt

Unterst�tzung und Funktion als Wissensvermittlung im MLOps-Projekt-setup basierend auf dem vorherigen Kunden-POC
Fokus in dem internen POC lag auf der automatisierten out-of-the- Box-Bereitstellung der gesamten MLOps-Projekt-Infrastruktur in Sagemaker
CI/CD, event rules, git repositories, endpoint definitions, bucket setup, IAM policy handling, naming conventions wurden �ber Cloudformation definiert und automatisiert bereitgestellt
Ausarbeitung von Dokumentation, Marketingmaterial, Systemdemo

Kunde

INFORMATION TECHNOLOGY

5 Monate

2021-10 - 2022-02

Evaluation Datenbereitstellung f�r Analyse Plattform

Senior Data Engineer Beratungsleistungen Engagement & Flexibilit�t Kubernetes administration ...

Rolle

Senior Data Engineer

Projektinhalte

Zur Datenbereitstellung von verschiedenen Datenquellen f�r die Analyseplattform eines Flugzeugherstellers wurde die Big Data/ Streaming Plattform Ververica f�r die Dateneinspeisung, -bereinigung und -bereitstellung evaluiert. Ververica ist von den Erfindern von Apache Flink entwickelt. Apache Flink ist einer der Big Player im Big Data / Real-time/Stream Umfeld.

Pers�nliche Beitr�ge zum Projekt

Setup Kubernetes Infrastruktur
Setup Ververica Plattform als eine Kubernetes Application mit Pod Bereitstellung �ber Helm chart management
Streaming job deployment �ber die Ververica Plattform unter der Verwendung der SQL API �ber den SQL Editor von Ververica
Ververica deployed Flink jobs als Kubernetes Pods
Dateneinspeisung und Datenverarbeitung f�r die Bereitstellung von Slowly Changing Dimensions zur Dimensions- und Faktenbereitstellung mit SQL

Kenntnisse

Beratungsleistungen Engagement & Flexibilit�t Kubernetes administration Kundenorientierung SQL Statements Stream Processing Ververica platform

Kunde

AEROSPACE

8 Monate

2021-03 - 2021-10

Aufbau einer self-service Big Data Plattform

Senior Data Engineer Google Kubernetes Engine Apache Kafka als Message Broker Kafka Streams & Kafka Connect f�r die Verarbeitung der Kafka Messages ...

Rolle

Senior Data Engineer

Projektinhalte

Aufbau einer self-service Big Data Plattform in der Google Cloud Platform. Im Tagesgesch�ft des Auftraggebers werden eine Vielzahl

von Daten in unterschiedlichen Systemen generiert und vorgehalten, zudem

existierte eine Data Warehouse L�sung on Premises. Ziel des Projekts war

Daten aus allen Datenquellen in einem zentralen Data Lake zu konsolidieren

und das Data Warehouse abzul�sen. Damit sollen die Daten zentral f�r Nutzer,

Partnerunternehmen sowie f�r neue Anwendungen verf�gbar gemacht werden.

Ein klassischer Data Lake erlaubt das Speichern von Rohdaten ungeachtet des

Datenformats und der Datenqualit�t. In diesem Projekt wurde diese Philosophie

bewusst zu Gunsten einer hohen Datenqualit�t und vertrauensw�rdigen

Datenlandschaft verworfen. Daher werden neue Daten schon bei der Anlieferung

von eigens entwickelten Microservices (Data-Ingest-Apps) je Datenquelle

gepr�ft, verarbeitet und im Fehlerfall abgelehnt. Diese Microservices sind in Containern implementiert und werden in der Kubernetes ausgef�hrt, so dass durch horizontale Skalierung selbst gro�e Datenmengen schnell verarbeitet werden k�nnen. Die so angenommenen Daten werden �ber einen Message Broker verteilt und asynchron mittels diverser weiterer Microservices weiterverarbeitet und letztendlich gespeichert.

Ziele

Aufbau eines Data Lakes bzw. Datawarehouse f�r heterogene strukturierte und unstrukturierte Datenquellen
Verwendung moderner Big Data Technologien
Anwendung der Public Cloud (Google Cloud Platform)
Hochgradige Skalierbarkeit
Gew�hrleistung hoher Datenqualit�t
Eliminieren von Datensilos im Unternehmen
Self-Service Funktionen f�r erh�hte Akzeptanz und Effizienz

Fakten

Datenvolumen:150 TB Daten
Datenquellen: 5000+ Topics, 500+ channels
Datenverarbeitung: 23MB/s eingehend; ~30 MB/s ausgehend

Pers�nliche Beitr�ge zum Projekt

Entwicklung, Unterst�tzung und Beratung zum architektonischen Design einer Kafka Streams Applikation �ber die SQL Abstraktionsschicht ksqlDB.
Deployment als eine Kubernetesapplikation
Aggregationen und Transformationen �ber den Kafka Tabellenmechanismus in Echtzeit

Kenntnisse

Google Kubernetes Engine Apache Kafka als Message Broker Kafka Streams & Kafka Connect f�r die Verarbeitung der Kafka Messages Java f�r die Implementierung von individuellen Microservices f�r die Datenverarbeitung Qlik Attunity f�r die Anbindung von SAP Google Big Query als Data Warehouse MongoDB als Datenspeicher Infrastructure Automatisierung via Terraform Apache Kafka Streams integration BigData Konzeption BigQuery Build Systems GCP Jenkins job configuration Kafka Connect development Kafka ksqlDB development Kubernetes administration sbt Scala Shell / Bash Stream Processing

Kunde

CONSUMER PRODUCTS

1 Monat

2021-05 - 2021-05

Unterst�tzung eines Basefarm Team

Senior System Engineer AWS CodePipeline AWS Development AWS Sagemaker ...

Rolle

Senior System Engineer

Projektinhalte

Die Unterst�tzung beinhaltete die Implementierung einer ML Ops Deployment Pipeline mit AWS Sagemaker f�r deren NLP Anwendungsfall.

Pers�nliche Beitr�ge zum Projekt

Aufsetzen einer gesamten templatebasierten Sagemaker pipeline unter der Verwendung einer angepassten ML Bibliothek zur Ausf�hrung einer Kurztextkategorisierung mit CPU und GPU Verarbeitung.
Pythonimplementierung f�r das Modelltraining unter der Verwendung des Spacy/Textcat Algorithmus zur Klassifikation mittels der Bereitstellung der darunter liegenden Ausf�hrungsumgebung �ber ein Pytorch/PythonImage
Pipelineimplementierung zur Modellevaluation und Modellregistrierung
Pipelineimplementierung zur Modellableitung und -bereitstellung in Echtzeit
Die Pipelinedefinition besteht aus einer CI/CD-Bereitstellung mit AWS Codepipeline bereitgestellt �ber Cloudformation

Kenntnisse

AWS CodePipeline AWS Development AWS Sagemaker Cloudformation MLOps Python

Kunde

INFORMATION TECHNOLOGY

4 Monate

2020-09 - 2020-12

RestApi Ingest low code

Senior Data Engineer Analytisches Denken Azure ARM Templating Azure Datafactory ...

Rolle

Senior Data Engineer

Projektinhalte

Zahlungen von Kunden f�r einen Getr�nkelieferanten bereitgestellt �ber eine RestAPI mussten in einen Data Lake eingespeist werden f�r weitere Berichterstellung, Analyse und Vergleich zu internen SAP-Systemen.

Pers�nliche Beitr�ge zum Projekt

RestApi Einspeisung
Konfigurierbares Aufsetzen einer Datenbereitstellungspipeline f�r Zahlungsdaten
Low code tooling Verwendung
Tooling: Azure Data Factory, Azure ARM deployment

Kenntnisse

Analytisches Denken Azure ARM Templating Azure Datafactory Azure Dev Jenkins job configuration Requirement engineering SQL Statements Pers�nliche Beitr�ge zum Projekt

Kunde

FOOD & BEVERAGE

5 Monate

2020-08 - 2020-12

Datalake Bereitstellung

Senior Data Engineer Azure ARM Templating Azure Datafactory Azure Dev ...

Rolle

Senior Data Engineer

Projektinhalte

Data Lake Bereitstellung f�r einen Getr�nkelieferanten zur Kombination verschiedener Datenquellen von verschiedenen Abteilungen in eine zentrale Datenbereitstellungsschicht f�r darauf aufbauendes Echtzeit-BI-Reporting.

Pers�nliche Beitr�ge zum Projekt

Azure Eventhub als Datenquelleneinspeisung in den Data Lake
Generisches Aufsetzen einer Pipeline zur Echtzeitverarbeitung und Datenbereitstellung in Echtzeit
Entwicklung einer konfigurierbaren ETL streaming Applikation zur Kombination verschiedener eventbasierter Datenquellen, welches �ber den Eventhub von Azure bereitgestellt wurden
Streaming framework ist konfigurierbar �ber Yaml-Dateien bereitgestellt, welche in spezieller Versionskontrolle integriert wurden
Bei �nderung der entsprechenden Konfiguration wurde eine neue Joausf�hrung �ber ein Databricks cluster gestartet
Infrastrukturbereitstellung �ber ARM templates
Job orchestration und Scheduling �ber Azure Datafactory
Tooling: Spark Structured Streaming, Jenkins, Databricks, Azure Datafactory, Azure Eventhub, Azure Blob Storage Gen2, Azure ARM

Kenntnisse

Azure ARM Templating Azure Datafactory Azure Dev BigData Konzeption Build Systems Continuous Delivery Data Lake Beratungsleistungen Docker Englisch Git Jenkins job configuration Requirement engineering sbt Scala Shell / Bash Spark Spark Structured Streaming SQL Statements UML

Kunde

FOOD & BEVERAGE

1 Jahr

2020-01 - 2020-12

Cloud Native Applications SIG

Data Engineer Apache Kafka Apache Kafka Streams integration BigData Konzeption ...

Rolle

Data Engineer

Projektinhalte

Entwicklung einer Blueprint L�sung eines Data Lakes basierend auf OpenShift und Cutting Edge Data Engineering.

Pers�nliche Beitr�ge zum Projekt

Entwicklung eines Kafka Streams real-time Datenfeed Microservice with Scala DSL
Bereitgestellt als ein Openshift/Kubernetes Deployment
Spezifische Echtzeitaggregationen mittels der Verwnedung von Kafka Tabellen und der Kafka Streams topology.
Entwicklung und Bereitstellung einer Kafka-Connect-Applikation als ein Openshift/Kubernetes deployment
Bereitstellung der gesamten Apache Kafkaarchitektur inkl, Zookeeper, Schemaregistry, Broker, Kafka-Connect, Control-center �ber eine spezielle Deploymentpipeline inkl. Containerisierung mit Jenkins und SBT

Kenntnisse

Apache Kafka Apache Kafka Streams integration BigData Konzeption Build Systems Continuous Delivery Docker Git Jenkins job configuration Kafka Connect development Kafka ksqlDB development sbt Scala

Kunde

INFORMATION TECHNOLOGY

8 Monate

2019-07 - 2020-02

Machine Learning Pipeline

Data Engineer Analytisches Denken Apache Airflow Atlassian Bamboo plan configuration ...

Rolle

Data Engineer

Projektinhalte

In Produktbereich Medienmessung einer Konsumforschungsfirma wurde ein konfigurierbares und generisches NLP framework zur Kurztextkategorisierung entwickelt. Ein konkreter Anwendungsfall war die Kategorisierung von Suchergebnissen von verschiedenen Suchmaschinen �ber Machine Learning.

Die Machine Learning Engine beinhaltet ein generischen Mechanismus �ber

SQL zum Feature Engineering und eine konfigurierbare Modellauswahl mit

Hyperparameterkonfiguration zusammen mit der Konfigurierbarkeit

verschiedener Data Science Transformatoren zur Tokenisierung, Bereinigung

und Vorverarbeitung und konfigurierbarer Validierungsfunktionalit�t.

Das Machine Learning framework wurde dediziert f�r die Verwendung von Data

Scientisten entwickelt. Bei der darunter liegenden Ausf�hrungsumgebung handelte es sich um Apache Spark, dadurch wurde die verteilte Ausf�hrung der Machine Learning Algorithmen auf einer Clusterumgebung gew�hrleistet.

Pers�nliche Beitr�ge zum Projekt

Pipeline setup mit Spark MLibs and Spark SQL mittels Scala
Dateibasierte Konfigurierbarkeit �ber JSON.
Featureengineering und Modelltraining wurde �ber eine verteilte AWS-EMR-Clusterumgebung ausgef�hrt und �ber Apache Airflow orchestriert
Featureengineering beinhaltete die Definition von SQL Ausdr�cken, welche �ber den Spark SQL Parser zur partitionierten verteilten Verarbeitung auf dem Cluster �bermittelt wurden
CI/CD mit der der Definition von Buildpl�nen und Bereitstellungspl�nen �ber Atlassians Bamboo.
SBT als Build tool f�r die Scalabibliotheksbereitstellung und Kompilierung

Kenntnisse

Analytisches Denken Apache Airflow Atlassian Bamboo plan configuration AWS Development AWS EMR BigData Konzeption Build Systems Continuous Delivery Git Gradle Build Tool Requirement engineering Scala Scrum Spark Spark ML Spark SQL

Kunde

MARKTFORSCHUNG

1 Jahr 2 Monate

2018-07 - 2019-08

Generische Datenanreicherungs- und Fusionierungspipeline

Data Engineer Apache Airflow AWS Development BigData Konzeption ...

Rolle

Data Engineer

Projektinhalte

Im Produktbereich Mediamessung eines Konsumforschungsunternehmens musste aus Gr�nden der stetigen Wiederverwendung statistischer Fusionierungs- und Imputationsalgorithmen zur k�nstlichen Panelerzeugung und- anreicherung eine generische Engine zur Verwendung von Data Scientisten entwickelt werden.

Das beinhaltete generisches Feature Engineering und spezifische firmeneigene

konfigurierbare Fusionierungsmechanismen.

Pers�nliche Beitr�ge zum Projekt

Generisches Feature Engineering mit SQL �ber eine Spark SQL-�bersetzung nach Java im Hintergrund mit Dateninput vom Hive Warehouse
Fusionsalgorithmus konfigurierbar von den Data Scientisten bereitgestellt und containerbasiert in eine AWS EMR-ECS Data Scientist Pipeline inkludiert und orchestriert �ber Apache Airflow.
CI/CD zur Buildplan- and Bereitstellungsplandefinition �ber Atlassian Bamboo

Kenntnisse

Apache Airflow AWS Development BigData Konzeption Build Systems Continuous Delivery Docker Git Gradle Build Tool Jenkins job configuration Requirement engineering Scrum Selbstmanagement Spark SQL Statements UML

Kunde

MARKTFORSCHUNG

1 Jahr 2 Monate

2017-07 - 2018-08

Apache Pig migration to Apache Spark SQL

Data Engineer Analytisches Denken Apache Airflow Apache Hadoop ...

Rolle

Data Engineer

Projektinhalte

In einem Konsumforschungsunternehmen mussten diverse Datenbereitstellungs, -verarbeitungs und -anreicherungs - Pipelines vonR o der Apache Pig nach Apache Spark aus Gr�nden der Wartbarkeit im Softwareengineering, Portierbarkeit und Performance von On-Premise in die Cloud migriert werden.

Pers�nliche Beitr�ge zum Projekt

Spark SQL durch die Abl�sung von Apache Pig/ R
Unit Testing
CI/CD for build plan and deployment plan definition over Atlassian Bamboo.
Apache Oozie nach Apache Airflow
Gradle upgrades

Kenntnisse

Analytisches Denken Apache Airflow Apache Hadoop Apache Oozie workflow configuration Apache Pig development Atlassian Bamboo plan configuration BigData Konzeption Build Systems Cloudera Dev Continuous Delivery Docker Git Gradle Build Tool Java Spark SQL Statements UML

Kunde

MARKTFORSCHUNG

8 Monate

2017-01 - 2017-08

Migration lokale Medienmessung Niederlande auf die globale Technologiestandardisierung

Data Engineer Apache Hadoop Apache Oozie workflow configuration Apache Pig development ...

Rolle

Data Engineer

Projektinhalte

Eine lokale Zweigstelle zur Medienmessung eines globalen Konsumforschungsunternehmens sollte auf den global standardisierten Technologiestack migriert werden.

Pers�nliche Beitr�ge zum Projekt

Datenfeedbereitstellung zur Internet-, Radio- und Fernsehmessung
Datenmodellgenerierung, Datenaggregationen, -transformationen, - projektionen mit Blacklisting und Whitelisting Mechanismen.
Apache Pig, Pig UDFs, Oozie auf einem On-Premise Cloudera-Hadoop Cluster
Buildtooling Gradle
Pigtests
Data ingest �ber Hive warehouse.
CI/CD mit Build und Bereitstellungspl�nen �ber Atlassian Bamboo

Kenntnisse

Apache Hadoop Apache Oozie workflow configuration Apache Pig development Atlassian Bamboo plan configuration BigData Konzeption Build Systems Cloudera Dev Continuous Delivery Gradle Build Tool Java Kundenorientierung Requirement engineering Selbstmanagement UML

Kunde

MARKTFORSCHUNG

Aus- und Weiterbildung

1 Monat

2023-03 - 2023-03

Machine Learning Engineering for Production (MLOps)

Zertifikat,

Abschluss

Zertifikat

2 Jahre 1 Monat

2021-02 - 2023-02

Microsoft Certified Azure IoT Developer Specialty

Zertifikat,

Abschluss

Zertifikat

2 Jahre 1 Monat

2021-01 - 2023-01

Lightbend Inc. Certified Reactive Architect Exam

Zertifikat,

Abschluss

Zertifikat

Abschluss

Master

Schwerpunkt

Thesis auf Anfrage

Abschluss

Bachelor

Schwerpunkt

Thesis auf Anfrage

2 Jahre 5 Monate

2004-09 - 2007-01

Apprenticeship

Business Informatics (IHK qualification),

Abschluss

Business Informatics (IHK qualification)

Kompetenzen

Top-Skills

Programmierung mit Aggregationen Stream Processing Batch Processing Kollaboration mit Data Scientisten

Produkte / Standards / Erfahrungen / Methoden

Profil:

Data Engineer mit zielorientierter und organisierter Arbeitsweise. Starker�Fokus auf der Verwendung hochqualitativer, innovativer cutting-edge�Technologien.�Stetige Ber�cksichtigung und Integration von Projekt-, Nutzer-, und�Unternehmensanforderungen.

Skillset (Programmiersprachen, Systeme, Tools):

Ab Initio; Apache Airflow; Apache Hadoop administration; Apache Kafka
Apache Kafka Streams integration; Apache Oozie workflow configuration
Apache Pig development; Atlassian Bamboo plan configuration, AWS EMR
AWS CodePipeline pipeline creation; AWS Development; AWS ECS, AWS IoT Core
AWS Lambda; AWS Sagemaker; Azure ARM Templating, Azure Datafactory
Azure Dev; Azure SQL; Beratung / Workshop-Leitung; Beratungsleistungen
BigData Konzeption; BigQuery; Build Systems; C#; Cloudera Dev; Cloudformation
Continuous Delivery; Data Lake Beratungsleistungen; Databricks; TortoiseSVN
Distributed Thinking; Docker; Eclipse Plugin Development; Flink; GCP; Git
Gradle Build Tool; Java; Jenkins job configuration; Kafka Connect development
Kafka ksqlDB development; Kubernetes administration; Maven; MLOps; Python
Requirement engineering; sbt; Scala; Scrum; shell; Shell / Bash, SQL Statements
Snowflake Spark; Spark ML; Spark SQL; Spark Structured Streaming; ; UML
Stream Processing; Terraform scripting;� Cloudera Data Platform Administration
Vertrieb / Angebotserstellung; Ververica platform; Vortr�ge und Pr�sentationen

Beruflicher Werdegang:

11/2023 - heute��

Rolle: Data Engineer

Kunde: DB Systel

10/2022 - 09/2023�

Rolle: Data Engineer

Kunde:�Orange Business�(former unbelievable�machine company)

03/2021 - 09/2022

Rolle: Data Engineer

Kunde:�The unbelievable�machine company

08/2020 - 12/2020�

Rolle: Data Engineer

Kunde: Durstexpress�

03/2020 - 07/2020�

Rolle: Data Engineer

Kunde:�The unbelievable�machine company

07/2016 - 02/2020

Rolle: Data Engineer

Kunde: GfK

10/2014 - 06/2016

Rolle: Software Engineer

Kunde: Fraunhofer FOKUS

10/2010 - 09/2014

Rolle: Software Engineer

Kunde: Fraunhofer FIRST

10/2008 - 09/2010�

Rolle:�Data Engineer with MS�Access

Kunde: ITDZ Berlin

02/2007 - 09/2008

Rolle:�Assistance Product�Management IT-integration services

Kunde: ITDZ Berlin�

Semesterpraktika:

09/2015 - 04/2016

Rolle:�Data Engineer

Kunde:�Plista (HDFS &�Cassandra evaluation)

01/2016 - 03/2016

Rolle: Software Engineer

Kunde:�Fraunhofer Fokus�(Cybersecurity -�Testframework)

Einsatzorte

L�nder

Deutschland

Remote-Arbeit

m�glich

Projekte

Projektinhalte

Zur Datenbereitstellung werden t�glich Dateien aus einem Objektspeicher in Iceberg Tabellen mittels einer cloudnativen Anwendung �berf�hrt.

Beitr�ge zum Projekt

Aufbau einer ETL-Strecke mittels Python Pandas Bibliothek und Orchestrierung �ber AWS Stepfunctions und Ausf�hrung �ber Glue-Jobs mit Python Shell und Lambdas und Infrastrukturbereitstellung �ber CDK

Kunde

TRANSPORT/LOGISTIK

Projektinhalte

Im Rahmen eines Blueprint-Projektes wurde eine Microservice-Architektur mit Micronaut und Microstream sowie gRPC als Austauschprotokoll als eine lokale Kubernetes-Applikation aufgesetzt.

Kunde

BLUEPRINT

1 Jahr 1 Monat

2022-07 - 2023-07

Datenbereitstellung f�r eine Analyseplattform

Senior Data Engineer Azure Dev Beratungsleistungen Engagement & Flexibilit�t ...

Rolle

Senior Data Engineer

Projektinhalte

Pers�nliche Beitr�ge zum Projekt

Dataintegration/Low-Coding mit ETL Tool Ab Initio.
Conceptual design zur IoT-Datenbereitstellung
Streaming job deployment zur Datenbereitstellung einer Analyseplattform
Konzept zur Schemaevolution und DataOps mit partieller Umsetzung

Kenntnisse

Kunde

AEROSPACE

1 Jahr 4 Monate

2022-03 - 2023-06

Tool migration data provisioning and curation analytical platform

Senior Data Engineer Analytisches Denken Azure Data Factory Beratungsleistungen ...

Rolle

Senior Data Engineer

Projektinhalte

Pers�nliche Beitr�ge zum Projekt

ETL-Pipeline Migration von SSIS flows zu Azure Data Factory Dataflows mit unterliegendem Spark cluster
Dateneinspeisung und Datenverarbeitung in das bestehende Data Warehouse mit Azure SQL
Individuelles lokales Testframework in C#

Kenntnisse

Analytisches Denken Azure Data Factory Beratungsleistungen Qualit�tsbewusstsein SQL Statements C#

Kunde

PUBLIC ADMINISTRATION

Rolle

Senior Data Engineer

Projektinhalte

Implementierung einer MLOps deployment pipeline mit AWS Sagemaker zur Bilderkennung als eine Out-of-the-box-solution f�r die Bereitstellung in verschiedenen Kundenumgebungen�

�Sagemaker pipeline setup f�r Data Science unter der Verwendung einer

selbst bereit gestellten Modellimplementierung zur Bilderkennung

Sagemaker pipelinedefinition unter der Verwendung von Sagemaker Python libraries zur image runtime definition
Pipeline setup mit Modellevaluation und Modellregistrierung
Modellinference zusammen mit der Modellendpunktbereitstellung
IaC zur CI/CD stack-Bereitstellung

Pers�nliche Beitr�ge zum Projekt

Unterst�tzung und Funktion als Wissensvermittlung im MLOps-Projekt-setup basierend auf dem vorherigen Kunden-POC
Fokus in dem internen POC lag auf der automatisierten out-of-the- Box-Bereitstellung der gesamten MLOps-Projekt-Infrastruktur in Sagemaker
CI/CD, event rules, git repositories, endpoint definitions, bucket setup, IAM policy handling, naming conventions wurden �ber Cloudformation definiert und automatisiert bereitgestellt
Ausarbeitung von Dokumentation, Marketingmaterial, Systemdemo

Kunde

INFORMATION TECHNOLOGY

5 Monate

2021-10 - 2022-02

Evaluation Datenbereitstellung f�r Analyse Plattform

Senior Data Engineer Beratungsleistungen Engagement & Flexibilit�t Kubernetes administration ...

Rolle

Senior Data Engineer

Projektinhalte

Pers�nliche Beitr�ge zum Projekt

Setup Kubernetes Infrastruktur
Setup Ververica Plattform als eine Kubernetes Application mit Pod Bereitstellung �ber Helm chart management
Streaming job deployment �ber die Ververica Plattform unter der Verwendung der SQL API �ber den SQL Editor von Ververica
Ververica deployed Flink jobs als Kubernetes Pods
Dateneinspeisung und Datenverarbeitung f�r die Bereitstellung von Slowly Changing Dimensions zur Dimensions- und Faktenbereitstellung mit SQL