Part of agile team (8 members) providing cloud data analytics platform for business depart- ments of world-leading automotive OEM. Migrating cloud infrastructure within AWS with Terraform. Challenging architecture of existing data pipelines and models. Skills: AWS: Redshift, lambda, Glue, Athena, Terraform, Python, CI/CD, PySpark, Collibra
Entwicklung mehrerer ETL-Strecken von IoT- und Versuchsdaten
Data Engineer, ArchitektPythonBashElasticsearch...
Data Engineer, Architekt
Mehrere ETL-Strecken fu?r IoT- und Versuchsdaten mit automatisierter Dashboard Visualisierung. Normalisierung verschiedener Datenformate.
Design und Umsetzung von Architektur für ETL- und Dashboarding-Anwendung auf IoT-Daten.
Fokus auf Security für sensitive Labordaten in Azure.
Aufsetzen und Implementierung von Clean Code- und Architekturprinzipien für Wartbarkeit von 11 Python Modulen.
Verringerung der Laufzeit um Faktor ~50.
Requirements Engineering als erster Ansprechpartner für Stakeholder.
PythonBashElasticsearchKibanaDockerAzure DevOps
PipelinesGitDashAzure Logic AppsAzure Container InstancesAzure App ServicesAzure Data Lake Storage Gen2Clean Code
Hersteller von Groß- und Industrieku?chengera?ten
8 Monate
2021-02 - 2021-09
Datenanbindung und Analysecluster
Data EngineerPythonPySparkDataBricks...
Data Engineer
Anbindung mehrerer externer Datenquellen an die Cloud-Datenplattform. Aufbau einer Analyse-Plattform zur Umsetzung skalierbarer Data Analytics Use-Cases mit Schwerpunkt Predictive Maintenance
Teil eines agilen Teams von 8 für datengetriebene Lösungen für Endkunden des Weltmarktführers.
Design und Umsetzung einer Plattform für ETL- und ML-Anwendungen zur Verarbeitung globaler IoT-Daten im Terabyte Bereich.
End-to-end Architektur von Anfragen der Rohdaten, über Data Lake zu ML- und Visualisierungsanwendungen.
Deployment von gemanagten Services im privaten Netzwerk.
Enablement von Entwicklern des Kunden.
PythonPySparkDataBricksBashDockerAzure DevOps PipelinesGitPostgreSQLAzure Container InstancesAzure App ServicesAzure Data Lake Storage Gen2
Hersteller von Groß- und Industrieku?chengera?ten
4 Monate
2020-11 - 2021-02
Migration mehrer ETL-Strecken und Anwendungen zu Microsoft Azure
Cloud EngineerPythonBashDocker...
Cloud Engineer
Mehrere ETL-Strecken fu?r IoT-Daten von weltweit verteilten Gera?ten und die dazugeho?rigen Anwendungen wurden samt Data Lake und Datenbank zu Microsoft Azure migriert.
Migration der ETL-Strecken zu Azure Container Instances
Migration der Anwendungen zu Azure App Services
Dokumentation
Containerized Deployment
Aufsetzen von Azure DevOps CI/CD Pipelines
PythonBashDockerAzure DevOps PipelinesGitAzure Logic
AppsAzure Container InstancesAzure App ServicesAzure Data
Lake Storage Gen2TerraformARM Templates
Hersteller von Groß- und Industrieku?chengera?ten
4 Monate
2020-06 - 2020-09
Weiterentwicklung eines Alarmierungs- und Vorhersagetools
Werkstudent - Data AnalyticsPythonscikit-learnfastai...
Werkstudent - Data Analytics
Design, Implementierung und Ausfu?hrung von Vergleichstests. Pra?sentieren und Dokumentieren der Ergebnisse.
Das Ziel war es, die DNN-Methoden von fastai und Self-Normalizing Neural Networks mit ?herko?mmlichen? ML-Methoden zum Prototyping auf kleinen tubula?ren Datensa?tzen zu vergleichen.
Das Ergebnis, das prima?r das interne Know-How der Firma erweitert, sprach stark fu?r die ?konventionellen? ML-Methoden.
Pythonscikit-learnfastaiTensorFlowPyTorch
inovex GmbH
1 Monat
2020-04 - 2020-04
COVID-19 Challenge HospiHelper
Machine Learning EngineerPythonAWSflask...
Machine Learning Engineer
Das Ziel war es, einen Prototyp zur regionalen Vorhersage von COVID-19 Fa?llen mit folgender Last auf die Krankenha?user. Zusa?tzliches Schaffen einer Plattform zur Ressourcenallokation.
Design und Implementierung des Prototyps in dynamischen, fully-remote Team
PythonAWSflaskJavaScriptPrototyping
Massachusetts Institute of Technology
7 Monate
2019-04 - 2019-10
A Preprocessing Pipeline for Thermal Comfort Data in Smart Buildings
Student - Data EngineerGrafanainfluxDBopenHAB...
Student - Data Engineer
Das Ziel war es, Open-Source Technologien zum Sammeln von thermisch-relevanten Daten zu vergleichen.
Design und Implementierung und Vergleich der Technologien als Daten-Pipeline.
Dokumentation und Pra?sentation der Ergebnisse
GrafanainfluxDBopenHABSQLite
Lehrstuhl fu?r Angewandte Softwareentwicklung
4 Monate
2018-10 - 2019-01
Bewertung von Apache Kudu
Werkstudent - Data EngineeringApache KuduApache HBase
Werkstudent - Data Engineering
Das Ziel war es, die Apache Kudu im Hadoop Ökosystem zu betrachten und zu beurteilen.
Design, Implementierung und Ausfu?hrung von Vergleichstests
Pra?sentieren und Dokumentieren der Ergebnisse
Apache KuduApache HBase
inovex GmbH
4 Monate
2018-04 - 2018-07
Analyse von Messgro?ßen der Teigherstellung
Student - Data ScientistPythonscikit-learnAWS...
Student - Data Scientist
Das Ziel war es, mittels einer machine-learning-basierten iOS App, den Knetvorgang zur industriellen Teigherstellung zu verbessern.
Analyse von Messgro?ßen der Teigherstellung
Design, Implementierung und Deployment von verschiedenen Machine Learning Methoden auf vorhandenen Daten
Dokumentation und Pra?sentation der Ergebnisse
Pythonscikit-learnAWSSwift
DIOSNA iMixIt
1 Jahr 8 Monate
2013-12 - 2015-07
Entwicklung von Anwendung zur modularen Getriebezusammenstellung
Werkstudent - Software-EntwicklerC#SQL
Werkstudent - Software-Entwickler
Entwicklung von Anwendung zur modularen Getriebezusammenstellung mittel User-Interface
Das Ziel war es, eine C#-Applikation zu schaffen, mit der Kunden Getriebe per Drag-and-Drop zusammenstellen und darauf Berechnungen durchfu?hren
Eigenständiges Arbeiten mit Feedback von Senior Software Engineer
C#SQL
red-ant GmbH
Aus- und Weiterbildung
Aus- und Weiterbildung
7 Monate
2020-07 - 2021-01
Data Engineering Nanodegree
Lernen von zentralen Aspekten des Data Engineering anhand praxisnaher Projekte in AWS Cloud-Umgebung
Ablegen von gewerteten Projekten
Kenntnisse:
AWS, Python, Shell, Airflow, SQL, PySpark, NoSQL, Data Modeling
Lo?sungsorientierte Softwareentwicklung von Grobkonzept bis zur Implementierung
Explorative Datenanalyse mit Python
Produkte / Standards / Erfahrungen / Methoden
Methodische Kenntnisse
Mehrfache Projekterfahrung im Konzipieren und Umsetzen von Data Engineering Use-Cases mittels Cloud-Technologien
Mehrfache Projekterfahrung im End-to-End Machine Learning
Schnelles Einlernen in neue technische und fachliche Felder
Langja?hrige Erfahrung mit agilen Arbeitsweisen (Scrum, Kanban, SAFe)
Soziale Kompetenzen
Teamfa?higkeit und kommunikative Sta?rke
Zielorientiertes und analytisches Denkvermo?gen
Kreative fachu?bergreifende Lo?sungskompetenz
Standards
SQL
JSON, YAML
CI/CD
Scrum
SAFe
Data Mesh
REST
XML, XML Schema
UML
Clean Code
Datenspeicher
Azure Blob Storage
Azure ADLS
Azure CosmosDB
Azure SQL Database
PostgreSQL
Delta Tables
Apache Iceberg
Apache Kafka
MongoDB
Apache Cassandra
SQLite
Amazon Redshift
influxDB
Cassandra
Azure
Azure Databricks
Azure Data Factory
Azure Functions
Azure Resource Manager (ARM)
Azure Storage Account
Azure Blob Storage
Data Lake Storage Gen2 (ADLS)
Azure Storage Queue
Azure Fileshare
Azure Synapse
Azure DevOps
Azure SQL DB
Azure Cosmos DB
Azure App Services
Azure Container Instances
Azure Key Vault
Azure Event Grid
Azure Virtual Networks
Azure Logic Apps
Azure Active Directory
Azure Event Hub
Azure Stream Analytics
Azure Table Storage
Microsoft Purview
AWS
S3
EC2
Redshift
Elastic Map Reduce (EMR)
Software / Tools
Databricks
PySpark
Spark Streaming
Apache Airflow
Apache Iceberg
Delta
Git
NiFi
Apache Kafka
NumPy
pandas
Bash
Docker
Elasticsearch
Kibana
Terraform
Flask
Grafana
scikit-learn
matplotlib
pre-commit
GitLab
GitHub
Atlassian Stack
LaTex
Jupyter Notebook/Lab
PyCharm
Visual Studio Code
Apache Hadoop File System
TensorFlow
PyTorch
XGBoost
Programmiersprachen
Python
SQL
Shell
JavaScript
Java
C#
Scala
R
C++
Swift
Auszeichnungen, Veröffentlichungen auf Anfrage
Einsatzorte
Einsatzorte
Deutschland, Schweiz, Österreich
möglich
Projekte
Projekte
5 Monate
2024-08 - 2024-12
Cloud Data Architect bei diconium data
Cloud Data ArchitectAWS: RedshiftlambdaGlue...
Cloud Data Architect
Part of agile team (8 members) providing cloud data analytics platform for business depart- ments of world-leading automotive OEM. Migrating cloud infrastructure within AWS with Terraform. Challenging architecture of existing data pipelines and models. Skills: AWS: Redshift, lambda, Glue, Athena, Terraform, Python, CI/CD, PySpark, Collibra
Entwicklung mehrerer ETL-Strecken von IoT- und Versuchsdaten
Data Engineer, ArchitektPythonBashElasticsearch...
Data Engineer, Architekt
Mehrere ETL-Strecken fu?r IoT- und Versuchsdaten mit automatisierter Dashboard Visualisierung. Normalisierung verschiedener Datenformate.
Design und Umsetzung von Architektur für ETL- und Dashboarding-Anwendung auf IoT-Daten.
Fokus auf Security für sensitive Labordaten in Azure.
Aufsetzen und Implementierung von Clean Code- und Architekturprinzipien für Wartbarkeit von 11 Python Modulen.
Verringerung der Laufzeit um Faktor ~50.
Requirements Engineering als erster Ansprechpartner für Stakeholder.
PythonBashElasticsearchKibanaDockerAzure DevOps
PipelinesGitDashAzure Logic AppsAzure Container InstancesAzure App ServicesAzure Data Lake Storage Gen2Clean Code
Hersteller von Groß- und Industrieku?chengera?ten
8 Monate
2021-02 - 2021-09
Datenanbindung und Analysecluster
Data EngineerPythonPySparkDataBricks...
Data Engineer
Anbindung mehrerer externer Datenquellen an die Cloud-Datenplattform. Aufbau einer Analyse-Plattform zur Umsetzung skalierbarer Data Analytics Use-Cases mit Schwerpunkt Predictive Maintenance
Teil eines agilen Teams von 8 für datengetriebene Lösungen für Endkunden des Weltmarktführers.
Design und Umsetzung einer Plattform für ETL- und ML-Anwendungen zur Verarbeitung globaler IoT-Daten im Terabyte Bereich.
End-to-end Architektur von Anfragen der Rohdaten, über Data Lake zu ML- und Visualisierungsanwendungen.
Deployment von gemanagten Services im privaten Netzwerk.
Enablement von Entwicklern des Kunden.
PythonPySparkDataBricksBashDockerAzure DevOps PipelinesGitPostgreSQLAzure Container InstancesAzure App ServicesAzure Data Lake Storage Gen2
Hersteller von Groß- und Industrieku?chengera?ten
4 Monate
2020-11 - 2021-02
Migration mehrer ETL-Strecken und Anwendungen zu Microsoft Azure
Cloud EngineerPythonBashDocker...
Cloud Engineer
Mehrere ETL-Strecken fu?r IoT-Daten von weltweit verteilten Gera?ten und die dazugeho?rigen Anwendungen wurden samt Data Lake und Datenbank zu Microsoft Azure migriert.
Migration der ETL-Strecken zu Azure Container Instances
Migration der Anwendungen zu Azure App Services
Dokumentation
Containerized Deployment
Aufsetzen von Azure DevOps CI/CD Pipelines
PythonBashDockerAzure DevOps PipelinesGitAzure Logic
AppsAzure Container InstancesAzure App ServicesAzure Data
Lake Storage Gen2TerraformARM Templates
Hersteller von Groß- und Industrieku?chengera?ten
4 Monate
2020-06 - 2020-09
Weiterentwicklung eines Alarmierungs- und Vorhersagetools
Werkstudent - Data AnalyticsPythonscikit-learnfastai...
Werkstudent - Data Analytics
Design, Implementierung und Ausfu?hrung von Vergleichstests. Pra?sentieren und Dokumentieren der Ergebnisse.
Das Ziel war es, die DNN-Methoden von fastai und Self-Normalizing Neural Networks mit ?herko?mmlichen? ML-Methoden zum Prototyping auf kleinen tubula?ren Datensa?tzen zu vergleichen.
Das Ergebnis, das prima?r das interne Know-How der Firma erweitert, sprach stark fu?r die ?konventionellen? ML-Methoden.
Pythonscikit-learnfastaiTensorFlowPyTorch
inovex GmbH
1 Monat
2020-04 - 2020-04
COVID-19 Challenge HospiHelper
Machine Learning EngineerPythonAWSflask...
Machine Learning Engineer
Das Ziel war es, einen Prototyp zur regionalen Vorhersage von COVID-19 Fa?llen mit folgender Last auf die Krankenha?user. Zusa?tzliches Schaffen einer Plattform zur Ressourcenallokation.
Design und Implementierung des Prototyps in dynamischen, fully-remote Team
PythonAWSflaskJavaScriptPrototyping
Massachusetts Institute of Technology
7 Monate
2019-04 - 2019-10
A Preprocessing Pipeline for Thermal Comfort Data in Smart Buildings
Student - Data EngineerGrafanainfluxDBopenHAB...
Student - Data Engineer
Das Ziel war es, Open-Source Technologien zum Sammeln von thermisch-relevanten Daten zu vergleichen.
Design und Implementierung und Vergleich der Technologien als Daten-Pipeline.
Dokumentation und Pra?sentation der Ergebnisse
GrafanainfluxDBopenHABSQLite
Lehrstuhl fu?r Angewandte Softwareentwicklung
4 Monate
2018-10 - 2019-01
Bewertung von Apache Kudu
Werkstudent - Data EngineeringApache KuduApache HBase
Werkstudent - Data Engineering
Das Ziel war es, die Apache Kudu im Hadoop Ökosystem zu betrachten und zu beurteilen.
Design, Implementierung und Ausfu?hrung von Vergleichstests
Pra?sentieren und Dokumentieren der Ergebnisse
Apache KuduApache HBase
inovex GmbH
4 Monate
2018-04 - 2018-07
Analyse von Messgro?ßen der Teigherstellung
Student - Data ScientistPythonscikit-learnAWS...
Student - Data Scientist
Das Ziel war es, mittels einer machine-learning-basierten iOS App, den Knetvorgang zur industriellen Teigherstellung zu verbessern.
Analyse von Messgro?ßen der Teigherstellung
Design, Implementierung und Deployment von verschiedenen Machine Learning Methoden auf vorhandenen Daten
Dokumentation und Pra?sentation der Ergebnisse
Pythonscikit-learnAWSSwift
DIOSNA iMixIt
1 Jahr 8 Monate
2013-12 - 2015-07
Entwicklung von Anwendung zur modularen Getriebezusammenstellung
Werkstudent - Software-EntwicklerC#SQL
Werkstudent - Software-Entwickler
Entwicklung von Anwendung zur modularen Getriebezusammenstellung mittel User-Interface
Das Ziel war es, eine C#-Applikation zu schaffen, mit der Kunden Getriebe per Drag-and-Drop zusammenstellen und darauf Berechnungen durchfu?hren
Eigenständiges Arbeiten mit Feedback von Senior Software Engineer
C#SQL
red-ant GmbH
Aus- und Weiterbildung
Aus- und Weiterbildung
7 Monate
2020-07 - 2021-01
Data Engineering Nanodegree
Lernen von zentralen Aspekten des Data Engineering anhand praxisnaher Projekte in AWS Cloud-Umgebung
Ablegen von gewerteten Projekten
Kenntnisse:
AWS, Python, Shell, Airflow, SQL, PySpark, NoSQL, Data Modeling