Data Scientist, Data Engineer, AI/ML Engineer, Cloud Architect
Aktualisiert am 15.05.2025
Profil
Freiberufler / Selbstständiger
Remote-Arbeit
Verfügbar ab: 18.05.2025
Verfügbar zu: 100%
davon vor Ort: 10%
Python
Azure
TensorFlow
R
SQL
PySpark
Scikit-learn
MLflow
Langchain
FastAPI
Airflow
MongoDB
Databricks
MS Fabric
Power BI
Plotly
Dash
Streamlit
Git
Docker
AWS
Terraform
OpenAI
Deutsch
Muttersprache
Englisch
Verhandlungssicher
Spanisch
Fortgeschritten

Einsatzorte

Einsatzorte

Deutschland, Schweiz, Österreich
möglich

Projekte

Projekte

7 Monate
2024-11 - 2025-05

Durchführung von Vorlesungen und Übungen

AWS-Dozent AWS Linux Python ...
AWS-Dozent
  • Durchführung von Vorlesungen und Übungen im Rahmen des AWS Restart Programms zur Zertifizierung von IT-Quereinsteigern zum AWS Cloud Practitioner und AWS Solutions Architect
  • Aufbau einer Data Science & KI Schulung
  • Aufbau einer Data Analytics & Power BI Schulung
  • Schulungsinhalte: AWS-Services (S3, EC2, VPC, IAM, CloudTrail, RDS, Redshift, Aurora, DynamoDB, ElastiCache, EBS, EFS, CLI, Systems Manager, Elastic Beanstalk, ECR, ECS, EKS, Fargate, Athena, OpenSearch, QuickSight, Glue, Flink, Kafka, Kinesis, SageMaker, Elastic Load Balancer, EC2 Auto-Scaling, Route 53, API-Gateway, KMS, Cognito, CloudFront, Lambda, SNS, SQS, Gateways, CloudWatch, CloudFormation), Linux, Python und SQL
AWS Linux Python SQL MS Power BI
TechPionier
Berlin
6 Monate
2024-05 - 2024-10

Entwicklung eines Large Language Modells mit Q&A Webapp

LLM Entwickler Python OpenAI LangChain ...
LLM Entwickler
  • Training eines Large Language Modells zur Zusammenfassung von individuellen Textdokumenten und Steuertexten
  • Aufteilung eines Textdokuments in Chunks, Erstellung von Embeddings, Abspeicherung in einer Vektor-Datenbank und Nutzung des LLMs mit LangChain
  • Entwicklung einer Webapp mit Streamlit, auf welcher Nutzer Textdokumente hochladen und Fragen zum Inhalt des Dokuments formulieren können
  • Nutzung des Large Language Modells zur Beantwortung von Fragen zu Textdokumenten
Python OpenAI LangChain Pinecone ChromaDB Streamlit
Goertz + Klingen + Tilg Steuerberater PartG mbB
Wegberg
1 Jahr 10 Monate
2022-08 - 2024-05

Konzipierung & Erstellung einer Cloud-Architektur

Cloud Architect Azure Cosmos DB Azure Data Factory Azure Blob Storage ...
Cloud Architect
  • Planung und Vorbereitung der Workshops zum Data Strategy & Analytics Assessment
  • Analyse des Status Quo und der Anforderungen an eine Zielarchitektur
  • Entwurf von mehreren möglichen Zielarchitekturen mit den jeweiligen Vor- und Nachteilen
  • Umsetzung der ausgewählten Architektur in Azure
  • Entwicklung eines Datenmodells und Definierung einer ETL-Strecke zur Verschiebung der Daten mit Azure Data Factory in eine Azure Cosmos DB
  • Transformation der Daten mit Dataflows in Azure Data Factory
  • Entwicklung von Azure Functions zur automatisierten Fehlererkennung und Lösung basierend auf Log-Dateien
  • Erstellung eines Power BI Reports zur Visualisierung und Analyse der LogDateien
  • Nutzung von Databricks und Spark zur Auswertung der Daten
  • Dokumentation der Architektur in Terraform und Confluence
Azure Cosmos DB Azure Data Factory Azure Blob Storage Azure Functions Azure DevOps Azure Data Studio Terraform Databricks PySpark MongoDB Compass Python PyMongo Power BI Jira Atlassian Confluence AAD ADLS Azure Event Hubs Azure Monitor MongoDB Compass
DAVID Systems GmbH
München
1 Jahr
2022-10 - 2023-09

Analyse von Einflussfaktoren auf die Bewerbungsanzahl von Jobausschreibungen

Data Scientist Python Scikit-learn Keras ...
Data Scientist
  • Import und Vorbereitung der Job-Statistiken
  • Korrelationsanalyse zur Identifizierung von Einflussfaktoren auf die Bewerbungsanzahl
  • Untersuchung und Visualisierung des Einflusses verschiedener Parameter auf die Anzahl der Bewerbungen und Listing-Einblendungen
  • Ermittlung von Klick-Kennzahlen und View-Kennzahlen sowie Analyse von Einflussfaktoren auf die Click-Through-Rate
  • Ableitung von Empfehlungen zur Steigerung der Bewerbungsanzahl für Stellenausschreibungen
  • Dokumentation und Präsentation der Ergebnisse
  • Entwicklung eines Machine Learning Modells zur Prädiktion der Bewerbungsanzahl auf Basis der Parameter einer Jobausschreibung
  • Deployment des Prädiktionsmodells als REST-API mit Docker auf der Google Cloud Plattform

Python Scikit-learn Keras TensorFlow Matplotlib Seaborn Plotly Jupyter Git Docker PowerPoint FastAPI Google Colab Google Cloud
Promotionbasis GmbH
München
3 Monate
2023-05 - 2023-07

Bildklassifikation mit KI & TensorFlow

Python Keras TensorFlow ...

  • Das Ziel liegt in der Entwicklung eines KI-Modells mit Tensor Flow, das für ein Bild einer Blume prädiktiert, welche Blume auf dem Bild abgebildet ist. Der Datensatz zum Training des Modells enthält 3.670 Bilder von Rosen, Tulpen, Sonnenblumen, Gänseblümchen und Pusteblumen


Vorgehen:

  • Laden des Datensatzes aus TensorFlow Datasets
  • Formatierung der Bilder in eine einheitliche Größe sowie Erstellung eines Trainings- und Testdatensatzes mit Batches und Prefetching zur schnelleren Verarbeitung der Datensätze beim Training der Modelle
  • Bildung und Training eines Convolutional Neural Networks zur Klassifikation der Bilder 
  • Implementierung von Data Augmentation zur Vermeidung von Overfitting
  • Erstellung eines Feature Extraction Modells mit einem EfficientNetB0 von TensorFlow Hub als Basis-Modell
  • Fine-Tuning des Feature Extraction Modells durch Training der Gewichte des BasisModells mit einer geringeren Lernrate und Early-Stopping
  • Erstellung einer Confusion-Matrix und Visualisierung der Vorhersagen auf dem Testsatz
  • Darstellung der Loss-Kurven von Modellen über mehrere Epochen
  • Generierung eines TensorBoards zur Auswertung der entwickelten Modelle


Resultate:

  • Das CNN-Modell erreichte eine Vorhersagegenauigkeit von 55,72% auf dem Testsatz. Da die Loss-Kurve auf ein Overfitting des Modells an den Trainingssatz hindeutet, wurden die Trainingsbilder durch Data Augmentation horizontal gespiegelt, rotiert oder gezoomt, um dem Modell beim Training eine größere Variation an Bildern bereitzustellen. Anschließend lag die Vorhersagegenauigkeit auf dem Testsatz bei 67,57%. Das Feature Extraction Modell erreichte nach fünf Epochen eine Vorhersagegenauigkeit von 93,46% auf dem Testsatz. Durch das Fine-Tuning kam das Modell dann auf eine Vorhersagegenauigkeit von 95,91% auf dem Testsatz.

Python Keras TensorFlow Matplotlib Google Colab Notebooks
Showcase
1 Jahr
2022-04 - 2023-03

Konzipierung & Erstellung einer Cloud-Architektur

Data Architect Azure SQL DB Azure Data Factory Azure Data Studio ...
Data Architect

  • Durchführung eines Data Assessment zum WMS Reporting
  • Analyse des Status Quo und der Anforderungen an eine Zielarchitektur
  • Entwurf von mehreren möglichen Zielarchitekturen mit den jeweiligen Vor- und Nachteilen
  • Umsetzung der ausgewählten Architektur in Azure
  • Aufsetzung eines ETL-Prozesses zur Verschiebung und Transformation der Daten von lokalen Oracle-Datenbanken in eine Azure SQL Datenbank mit Azure Data Factory

Azure SQL DB Azure Data Factory Azure Data Studio PowerPoint Power BI Dataverse SharePoint AAD ADLS Azure Data Studio
LGI Logistics Group International GmbH
München
7 Monate
2022-05 - 2022-11

Ähnlichkeitsanalyse und Clustering von Sachnummern im Einkauf mit KI

KI Entwickler Scikit-learn Keras Tensorflow ...
KI Entwickler

  • Import und Vorbereitung der verschiedenen Datenquellen
  • Ähnlichkeitsanalyse basierend auf der Produktbezeichnung mit NLP
  • Erstellung einer Ähnlichkeitstabelle zum Vergleich der Sachnummern mit mehreren Parametern
  • Entwicklung eines neuronalen Netzes zur Prädiktion eines Ähnlichkeitswertes zwischen Sachnummern
  • Implementierung eines Algorithmus zur Identifikation von Clustern mit ähnlichen Produkten
  • Berechnung des Referenzpreises und Einsparungspotenzial für jedes Cluster
  • Generierung und Export einer Datei mit den Ergebnissen des ClusterAlgorithmus
  • Aufsetzung einer Schnittstelle zum Weiter- oder Neu-Trainieren des neuronalen Netzes mit Anwender-Feedback
  • Deployment des KI-Modells innerhalb der AWS-Umgebung
  • Einsparpotenzial für BMW von über 100 Mio. ? pro Jahr

Scikit-learn Keras Tensorflow Jupyter Git AWS SonarQube Python (Pandas NumPy Nltk itertools Tensorflow) Jupyter Notebooks Python AWS IAM AWS S3 AWS EC2
BMW AG
München
8 Monate
2022-03 - 2022-10

Analyse von Fahrdaten zur Ermittlung des Elektrifizierungspotenzials von LKWs

Data Scientist Python Here Maps API Plotly ...
Data Scientist

  • Identifizierung der Schicht- und Standzeiten von LKWs anhand von TrackingDaten
  • Untersuchung der Points of Interest in der Umgebung von Standorten der LKWs mithilfe der Here Maps API
  • Ermittlung der optimalen Anzahl und Orte für Ladestationen von Elektroautos
  • Implementierung von Algorithmen zur Bestimmung der elektrifizierbaren LKWs auf Basis der fahrspezifischen Daten
  • Entwicklung eines Dashboards mit Plotly Dash zur Analyse des Fahrverhaltens und des Elektrifizierungspotenzials
  • Dokumentation der Algorithmen in Confluence

Python Here Maps API Plotly Dash PyInstaller Jupyter Visual Studio Code Jira Atlassian Confluence Git AWS S3 AWS EC2
MAN Truck & Bus SE
München
8 Monate
2021-07 - 2022-02

Personalvermittlung mit KI

Data Scientist Scikit-learn Plotly Dash ...
Data Scientist

  • Automatisierte Aufbereitung von Stellenausschreibungen und Speicherung in einer MongoDB durch die Aufsetzung eines ETL-Prozesses mit Python
  • Implementation eines intelligenten Algorithmus zur Selektion der optimalen Kontaktdaten für eine Vakanz
  • Implementation von Web-Crawlern für Kandidatenprofile auf Linkedin und Xing
  • Entwicklung von Machine Learning Modellen zur automatisierten Identifikation von passenden Vakanzen für einen Kandidaten
  • Erstellung einer R-Shiny Web App zur statistischen Auswertung von psychologischen Daten
  • Mustererkennung und Implementierung von psychologischen Modellen
  • Aufsetzung eines Python-Dashboards zur Marktanalyse mit Geo Heatmaps, Zeitreihenanalyse und Machine Learning Vorhersagen
  • Auswertung der gesendeten E-Mails und Webhooks zur Optimierung der Response-Rate
  • Anwendung von maschinellen Lernverfahren zur Prädiktion der Request- und Blacklist-Wahrscheinlichkeit, bevor die Präsentation eines Kandidaten an ein Unternehmen gesendet wird
  • Entwicklung von CI/CD Pipelines mit Git und Slackbot Integration

Scikit-learn Plotly Dash Jupyter Heroku R Shiny R Studio AWS S3 MongoDB Mongo Cloud Jira Atlassian Git Linux Python (Scikit-learn Selenium Plotly Dash) AWS S3 Jupyter Notebooks PyCharm Python R Shiny AWS IAM
auf Anfrage
Düsseldorf
5 Monate
2021-02 - 2021-06

Einsatz von Data Science im Fußball

Python Scikit-learn Keras ...
  • Masterarbeit- Das Projektziel besteht in der Entwicklung von Ansätze zum Einsatz von Data Science im Fußball, um die eigene Mannschaftsleistung zu verbessern, eine möglichst genaue Gegneranalyse durchzuführen und neue Spieler oder Talente zu entdecken. Der genutzte Datensatz von StatsBomb enthält Event-Daten zu 879 Fußballspielen, welche als json-Dateien vorliegen und Aktionen wie Pässe, Schüsse, Zweikämpfe, Dribblings, Foulspiele oder Standardsituationen beschreiben


Vorgehen

  • Entwicklung eines Expected Goals Modell zur Prädiktion der Trefferwahrscheinlichkeit eines Torschusses im Fußball mithilfe von Machine Learning
  • Nutzung des Expected Goals Modell zum Scouting von besonders guten Torjägern, Torvorbereitern und Torhütern.
  • Analyse der Entstehung von Toren, indem gefährliche Spielfeldzonen für Torschüsse und Torvorlagen identifiziert sowie verschiedene Angriffsmuster und Standardsituationen ausgewertet wurden.
  • Evaluation der Genauigkeit und Effektivität des Passspiels einzelner Spieler.
  • Untersuchung von Passverbindungen und Passrichtungen, um Passnetzwerke zwischen den Spielfeldzonen und Spielern einer Mannschaft zu erkennen.
  • Statistische Ermittlung des Spielsystems von Mannschaften durch die Auswertung des Positionsspiels der einzelnen Spieler und die Ableitung eine realtaktische Aufstellung.
  • Erstellung von Spielerprofilen, welche zur Kaderzusammenstellung sowie zur Entwicklung eines passenden Spielsystems genutzt werden können.


Resultate:

  • Mithilfe der entwickelten Methoden kann das Angriffsspiel, Passspiel und Spielsystem der eigenen Mannschaft analysiert und optimiert werden. Zudem eignen sich diese Verfahren zur gezielten Gegneranalyse und zum Spielerscouting sowohl bei der Entdeckung von Talenten oder unterbewerteten Spielern als auch bei der passenden Zusammenstellung des Kaders.

Python Scikit-learn Keras TensorFlow Jupyter Notebooks R foci R Studio Plotly Dash
1 Jahr 4 Monate
2020-03 - 2021-06

Analyse von E-Mails mit NLP-Techniken

Data Scientist Python Scikit-learn Statsmodels ...
Data Scientist

  • Analyse des E-Mail-Verkehrs eines Unternehmens zur Identifizierung des Zeitpunktes, an dem sich intern eine Insolvenz abgezeichnet hat
  • Extraktion der Informationen aus einem Terrabyte an E-Mails im PST-Format und Abspeicherung in einer SQL-Datenbank
  • Entwicklung eines ML-Modells zur Extraktion der Signatur von E-Mails
  • Generierung von E-Mail-Flussdiagrammen und Chord-Diagrammen zur Darstellung der Kommunikationswege zwischen den Angestellten
  • Sentimentanalyse zur Auswertung der Stimmung innerhalb der Organisation im zeitlichen Verlauf
  • Topic Modeling zur Aufdeckung von Themen und Gruppierung von E-Mails in verschiedene Themengebiete
  • Entwicklung eines Klassifikationsmodells zur Detektion von rechtlich relevanten E-Mails

Python Scikit-learn Statsmodels Seaborn Jupyter SQL SSMS Hadoop Microsoft Power BI Microsoft Teams SharePoint Git Pypff Langdetect Graphviz Bokeh SQLAlchemy pyodbc NLTK spaCy Microsoft SQL Server Jupyter Notebooks Python (Pypff BERT)
Anwaltskanzlei
Düsseldorf
1 Jahr 4 Monate
2020-03 - 2021-06

Beratung von Unternehmen in Krisensituationen

Data Scientist Python Scikit-learn Statsmodels ...
Data Scientist
  • Entwicklung von Feature Selection Verfahren zur Preistreiberanalyse
  • Analyse des Quote-to-Cash Prozesses zur Optimierung eines Supply Chain Managements
  • Analyse und Auswertung von Finanzbuchhaltungsdaten
Python Scikit-learn Statsmodels Seaborn Jupyter SQL SSMS Hadoop Microsoft Power BI Microsoft Teams SharePoint Git
INSO Projects GmbH
Düsseldorf
3 Monate
2020-11 - 2021-01

Feature Selection Verfahren zur Preistreiberanalyse

Python NumPy Pandas ...

  • Seminararbeit - Ziel dieser Arbeit ist es einige Feature Selection Verfahren auf verschiedenen Datensätzen mit unterschiedlichen ML-Modellen zur Preistreiberanalyse zu evaluieren. Dabei werden sowohl suchbasierte als auch korrelationsbasierte Feature Selection Verfahren hinsichtlich der Reduzierung der Anzahl an Features und der erzielten Vorhersagegenauigkeit untersucht


Vorgehen:

  • Untersuchung von korrelationsbasierten und suchbasierten Feature Selection Verfahren sowie Embedded-Methoden und Principal Component Analysis Implementierung verschiedener Feature Selection Methoden in Python Anwendung der Feature Selection Verfahren auf vier Datensätzen zur Preistreiberanalyse Entwicklung von ML-Modellen zur Prädiktion von Auto- und Immobilienpreisen Evaluation der Feature Selection Verfahren anhand der Ergebnisse der ML-Modelle


Resultate:

  • Die Wahl des Feature Selection Verfahrens ist abhängig vom Datensatz, ML-Modell und Projektziel, sodass es kein standardisiertes Verfahren zur Feature Selection gibt. Allerdings lässt sich aus den Projektergebnissen folgern, dass die suchbasierten Feature Selection Methoden jeweils sehr ähnliche Ergebnisse liefern. Die Feature Extraction durch PCA führt zur stärksten Dimensionsreduktion, aber auch zu schwächeren Vorhersagegenauigkeiten. Zudem ist die Wahl des Feature Selection Verfahrens umso wichtiger, je weniger Zeilen im Datensatz vorliegen und je höher die Modellkomplexität ist.

Python NumPy Pandas Scikit-learn Statsmodels SciPy Matplotlib Seaborn
10 Monate
2018-11 - 2019-08

Entwicklung einer Desktopanwendung zur Finanz- und Personalverwaltung

Mathematisch-technischer Softwareentwickler C# WPF Visual Studio ...
Mathematisch-technischer Softwareentwickler
  • Implementation des Backends und Frontends einer Desktopanwendung mit C# und WPF
  • Management der SQL-Datenbank
  • Migration der Daten aus einer SAP-Datenbank
C# WPF Visual Studio SQL SAP Git YouTrack
Cybernetics Lab IMA & IfU - RWTH Aachen
Aachen
2 Jahre 3 Monate
2016-09 - 2018-11

Implementation einer Webplattform zur Fabrikplanung, Cybernetics Lab IMA & IfU

Mathematisch-technischer Softwareentwickler Java Spring Hibernate ...
Mathematisch-technischer Softwareentwickler
  • Implementation des Java-Backends mit Spring und Hibernate
  • Management der SQL-Datenbank
  • Entwicklung und Optimierung der Datenmodelle
  • Evaluation, Aufsetzung and Datenmigration zu einer NoSQL-Datenbank zur Performancesteigerung (MongoDB, Neo4j)
  • Aufsetzung von CI/CD Pipelines mit automatisierten Unit Tests, Maven Build Prozessen und Deployments auf einem Linux-Server
  • Implementation und Anbindung eines Python-Backends für Deep Learning mit Tensorflow
Java Spring Hibernate Postman SQL MySQL Workbench MongoDB Neo4j Python Tensorflow Git JUnit IntelliJ IDEA YouTrack MySQL Workbench IntelliJ IDEA
Cybernetics Lab IMA & IfU - RWTH Aachen
Aachen

Aus- und Weiterbildung

Aus- und Weiterbildung

3 Monate
2025-03 - 2025-05

AWS Certified Machine Learning ? Specialty

Amazon Web Services
Amazon Web Services
3 Monate
2025-02 - 2025-04

MongoDB Associate Data Modeler

MongoDB
MongoDB
7 Monate
2024-10 - 2025-04

AWS Certified Solutions Architect ? Professional

Amazon Web Services
Amazon Web Services
3 Monate
2025-01 - 2025-03

MongoDB Associate Developer

MongoDB
MongoDB
4 Monate
2024-11 - 2025-02

AWS re/Start Accredited Instructor

Amazon Web Services
Amazon Web Services
3 Monate
2024-08 - 2024-10

AWS Certified Solutions Architect ? Associate

Amazon Web Services
Amazon Web Services
5 Monate
2024-01 - 2024-05

Fabric Analytics Engineer Associate

Microsoft
Microsoft
4 Monate
2023-11 - 2024-02

Power BI Data Analyst Associate

Microsoft
Microsoft
5 Monate
2023-07 - 2023-11

Databricks Certified Data Engineer Associate

Databricks
Databricks
6 Monate
2023-02 - 2023-07

TensorFlow Developer Certificate

Google
Google
3 Monate
2022-12 - 2023-02

AWS Certified Cloud Practitioner

Amazon Web Services
Amazon Web Services
3 Monate
2022-11 - 2023-01

Azure Data Scientist Associate

Microsoft
Microsoft
4 Monate
2022-04 - 2022-07

Azure Data Engineer Associate

Microsoft
Microsoft
1 Jahr 11 Monate
2019-09 - 2021-07

Angwandte Mathematik und Informatik

Master of Science, FH Aachen
Master of Science
FH Aachen
  • Statistik
  • Machine Learning
  • Data Science
  • Masterarbeit: auf Anfrage, Note: 1,0
3 Jahre
2016-08 - 2019-07

Scientific Programming

Bachelor of Science, FH Aachen
Bachelor of Science
FH Aachen

  • Dualer Bachelor-Studiengang in Mathematik und Informatik mit einer Ausbildung zum Mathematisch-technischen Softwareentwickler
  • Zertifizierung zum DataScienceMATSE
  • Bachelorarbeit: auf Anfrage , Note: 1,3

3 Jahre
2016-08 - 2019-07

DataScienceMATSE

FH Aachen
FH Aachen
Abschluss von 3 Data Science Modulen und Verfassung einer Bachelorarbeit im Data Science Bereich

Position

Position

  • Data Scientist
  • AI Developer
  • Data Engineer
  • Cloud Architect

Kompetenzen

Kompetenzen

Top-Skills

Python Azure TensorFlow R SQL PySpark Scikit-learn MLflow Langchain FastAPI Airflow MongoDB Databricks MS Fabric Power BI Plotly Dash Streamlit Git Docker AWS Terraform OpenAI

Schwerpunkte

Azure
Experte
Databricks
Fortgeschritten
MS Fabric
Experte
AWS
Experte
Power BI
Experte

Beratungsschwerpunkte:

  • Data Science: Entwicklung von KI-Modellen mit Machine & Deep Learning, NLP, LLMs, Computer Vision, Datenvisualisierung, Mustererkennung
  • Data Engineering: Architektur und Implementierung von Datenpipelines, Konzeption und Aufbau einer Cloud Infrastruktur
  • Data Analytics: Datenanalyse, Dashboard Erstellung, Webentwicklung
  • Tools: Python, Spark, SQL, R, TensorFlow, Azure, AWS, Databricks, MS Fabric, Power BI, Git, Docker

Produkte / Standards / Erfahrungen / Methoden

IT-Kompetenz:

  • Frameworks: NumPy, Pandas, Scikit-learn, TensorFlow, Keras, MLflow, Seaborn, Statsmodels, OpenAI, Langchain, FastAPI, Airflow
  • Visualisierungstools: Power BI, Tableau, Plotly Dash, Streamlit, R Shiny
  • Azure Data Factory, Azure Synapse, Azure Functions, Azure Cosmos DB
  • MS Fabric (Delta Lake, Lakehouse, One Lake, Spark Notebooks)
  • AWS (IAM, S3, EC2, SageMaker, Glue, Lambda, CloudFormation, ?)
  • Databricks
  • Terraform
  • Docker
  • Confluence, Jira Atlassian, Azure DevOps, Git
  • Linux, Heroku


Fach- und Methodenkompetenz:

Fachlich:

  • ETL (Business Intelligence & Analytics)
  • Datenvorverarbeitung
  • Datenanalyse
  • Machine Learning
  • Deep Learning
  • Feature Engineering & Selection
  • Mustererkennung
  • Natural Language Processing
  • Large Language Modelle
  • Computer Vision
  • Datenvisualisierung
  • Web Crawling
  • Webentwicklung
  • Statistik


Methodisch:

  • Projektplanung
  • Prozessmanagement
  • Agile Methoden, Scrum
  • DevOps, MLOps
  • Schnittstellenkonzeption und -betreuung
  • Integration und Migration
  • Analytisches Denken und Handeln
  • Planungs- und Organisationsfähigkeit
  • Prozessoptimierung und -automatisierung
  • Reports und Dashboards


Beruflicher Werdegang:

06/2024 - heute:

Rolle: Freelancer (Data Scientist & Engineer)


Aufgaben:

  • Entwicklung eines Large Language Modells mit Q&A Webapp
  • Dozent für eine 6-monatige AWS-Schulung


03/2022 - 05/2024:

Rolle: Data Engineer & Scientist

Kunde: Datalytics GmbH


Aufgaben:

  • Entwicklung einer KI zur Ähnlichkeitsanalyse von Produkten im Einkauf bei einem Automobilhersteller, Einsparungspotenzial: > 100 Mio. ? p. a.
  • Entwicklung von Cloud-Architekturen in Azure


07/2021 - 02/2022:

Rolle: Data Scientist

Kunde: IAM Global GmbH


Aufgaben:

  • Entwicklung eines Systems zur Personalvermittlung, welches mithilfe von künstlicher Intelligenz und psychologischen Modellen möglichst passende Vakanzen für einen Kandidaten findet


03/2020 - 06/2021:

Rolle: Werkstudent Data Science

Kunde: INSO Projects GmbH


Aufgaben:

  • Natural Language Processing zur E-Mail-Analyse
  • Analyse und Optimierung der Supply Chain

09/2016 - 08/2019:

Rolle: Softwareentwickler

Kunde: Cybernetics Lab IMA & IfU


Aufgaben:

  • Entwicklung einer Webplattform zur Fabrikplanung
  • Erstellung einer Desktopanwendung zur Finanz- & Personalverwaltung

Programmiersprachen

Python
Experte
R
Experte
SQL
Experte
Java
Experte
PySpark
Experte
C#
Fortgeschritten
Python-Bibliotheken
NumPy, Pandas, Scikit-learn, TensorFlow, Keras, MLflow, Seaborn, Statsmodels, OpenAI, Langchain, FastAPI, Airflow, Streamlit, Plotly, Dash
SAS

Datenbanken

MySQL
Experte
Oracle
Fortgeschritten
MongoDB
Experte
Pinecone
Fortgeschritten
Azure Cosmos DB
Experte
Delta Lake
Experte
DynamoDB
Fortgeschritten
ChromaDB

Branchen

Branchen

  • Automobil
  • Logistik
  • Medien
  • Personalvermittlung
  • Forschung

Einsatzorte

Einsatzorte

Deutschland, Schweiz, Österreich
möglich

Projekte

Projekte

7 Monate
2024-11 - 2025-05

Durchführung von Vorlesungen und Übungen

AWS-Dozent AWS Linux Python ...
AWS-Dozent
  • Durchführung von Vorlesungen und Übungen im Rahmen des AWS Restart Programms zur Zertifizierung von IT-Quereinsteigern zum AWS Cloud Practitioner und AWS Solutions Architect
  • Aufbau einer Data Science & KI Schulung
  • Aufbau einer Data Analytics & Power BI Schulung
  • Schulungsinhalte: AWS-Services (S3, EC2, VPC, IAM, CloudTrail, RDS, Redshift, Aurora, DynamoDB, ElastiCache, EBS, EFS, CLI, Systems Manager, Elastic Beanstalk, ECR, ECS, EKS, Fargate, Athena, OpenSearch, QuickSight, Glue, Flink, Kafka, Kinesis, SageMaker, Elastic Load Balancer, EC2 Auto-Scaling, Route 53, API-Gateway, KMS, Cognito, CloudFront, Lambda, SNS, SQS, Gateways, CloudWatch, CloudFormation), Linux, Python und SQL
AWS Linux Python SQL MS Power BI
TechPionier
Berlin
6 Monate
2024-05 - 2024-10

Entwicklung eines Large Language Modells mit Q&A Webapp

LLM Entwickler Python OpenAI LangChain ...
LLM Entwickler
  • Training eines Large Language Modells zur Zusammenfassung von individuellen Textdokumenten und Steuertexten
  • Aufteilung eines Textdokuments in Chunks, Erstellung von Embeddings, Abspeicherung in einer Vektor-Datenbank und Nutzung des LLMs mit LangChain
  • Entwicklung einer Webapp mit Streamlit, auf welcher Nutzer Textdokumente hochladen und Fragen zum Inhalt des Dokuments formulieren können
  • Nutzung des Large Language Modells zur Beantwortung von Fragen zu Textdokumenten
Python OpenAI LangChain Pinecone ChromaDB Streamlit
Goertz + Klingen + Tilg Steuerberater PartG mbB
Wegberg
1 Jahr 10 Monate
2022-08 - 2024-05

Konzipierung & Erstellung einer Cloud-Architektur

Cloud Architect Azure Cosmos DB Azure Data Factory Azure Blob Storage ...
Cloud Architect
  • Planung und Vorbereitung der Workshops zum Data Strategy & Analytics Assessment
  • Analyse des Status Quo und der Anforderungen an eine Zielarchitektur
  • Entwurf von mehreren möglichen Zielarchitekturen mit den jeweiligen Vor- und Nachteilen
  • Umsetzung der ausgewählten Architektur in Azure
  • Entwicklung eines Datenmodells und Definierung einer ETL-Strecke zur Verschiebung der Daten mit Azure Data Factory in eine Azure Cosmos DB
  • Transformation der Daten mit Dataflows in Azure Data Factory
  • Entwicklung von Azure Functions zur automatisierten Fehlererkennung und Lösung basierend auf Log-Dateien
  • Erstellung eines Power BI Reports zur Visualisierung und Analyse der LogDateien
  • Nutzung von Databricks und Spark zur Auswertung der Daten
  • Dokumentation der Architektur in Terraform und Confluence
Azure Cosmos DB Azure Data Factory Azure Blob Storage Azure Functions Azure DevOps Azure Data Studio Terraform Databricks PySpark MongoDB Compass Python PyMongo Power BI Jira Atlassian Confluence AAD ADLS Azure Event Hubs Azure Monitor MongoDB Compass
DAVID Systems GmbH
München
1 Jahr
2022-10 - 2023-09

Analyse von Einflussfaktoren auf die Bewerbungsanzahl von Jobausschreibungen

Data Scientist Python Scikit-learn Keras ...
Data Scientist
  • Import und Vorbereitung der Job-Statistiken
  • Korrelationsanalyse zur Identifizierung von Einflussfaktoren auf die Bewerbungsanzahl
  • Untersuchung und Visualisierung des Einflusses verschiedener Parameter auf die Anzahl der Bewerbungen und Listing-Einblendungen
  • Ermittlung von Klick-Kennzahlen und View-Kennzahlen sowie Analyse von Einflussfaktoren auf die Click-Through-Rate
  • Ableitung von Empfehlungen zur Steigerung der Bewerbungsanzahl für Stellenausschreibungen
  • Dokumentation und Präsentation der Ergebnisse
  • Entwicklung eines Machine Learning Modells zur Prädiktion der Bewerbungsanzahl auf Basis der Parameter einer Jobausschreibung
  • Deployment des Prädiktionsmodells als REST-API mit Docker auf der Google Cloud Plattform

Python Scikit-learn Keras TensorFlow Matplotlib Seaborn Plotly Jupyter Git Docker PowerPoint FastAPI Google Colab Google Cloud
Promotionbasis GmbH
München
3 Monate
2023-05 - 2023-07

Bildklassifikation mit KI & TensorFlow

Python Keras TensorFlow ...

  • Das Ziel liegt in der Entwicklung eines KI-Modells mit Tensor Flow, das für ein Bild einer Blume prädiktiert, welche Blume auf dem Bild abgebildet ist. Der Datensatz zum Training des Modells enthält 3.670 Bilder von Rosen, Tulpen, Sonnenblumen, Gänseblümchen und Pusteblumen


Vorgehen:

  • Laden des Datensatzes aus TensorFlow Datasets
  • Formatierung der Bilder in eine einheitliche Größe sowie Erstellung eines Trainings- und Testdatensatzes mit Batches und Prefetching zur schnelleren Verarbeitung der Datensätze beim Training der Modelle
  • Bildung und Training eines Convolutional Neural Networks zur Klassifikation der Bilder 
  • Implementierung von Data Augmentation zur Vermeidung von Overfitting
  • Erstellung eines Feature Extraction Modells mit einem EfficientNetB0 von TensorFlow Hub als Basis-Modell
  • Fine-Tuning des Feature Extraction Modells durch Training der Gewichte des BasisModells mit einer geringeren Lernrate und Early-Stopping
  • Erstellung einer Confusion-Matrix und Visualisierung der Vorhersagen auf dem Testsatz
  • Darstellung der Loss-Kurven von Modellen über mehrere Epochen
  • Generierung eines TensorBoards zur Auswertung der entwickelten Modelle


Resultate:

  • Das CNN-Modell erreichte eine Vorhersagegenauigkeit von 55,72% auf dem Testsatz. Da die Loss-Kurve auf ein Overfitting des Modells an den Trainingssatz hindeutet, wurden die Trainingsbilder durch Data Augmentation horizontal gespiegelt, rotiert oder gezoomt, um dem Modell beim Training eine größere Variation an Bildern bereitzustellen. Anschließend lag die Vorhersagegenauigkeit auf dem Testsatz bei 67,57%. Das Feature Extraction Modell erreichte nach fünf Epochen eine Vorhersagegenauigkeit von 93,46% auf dem Testsatz. Durch das Fine-Tuning kam das Modell dann auf eine Vorhersagegenauigkeit von 95,91% auf dem Testsatz.

Python Keras TensorFlow Matplotlib Google Colab Notebooks
Showcase
1 Jahr
2022-04 - 2023-03

Konzipierung & Erstellung einer Cloud-Architektur

Data Architect Azure SQL DB Azure Data Factory Azure Data Studio ...
Data Architect

  • Durchführung eines Data Assessment zum WMS Reporting
  • Analyse des Status Quo und der Anforderungen an eine Zielarchitektur
  • Entwurf von mehreren möglichen Zielarchitekturen mit den jeweiligen Vor- und Nachteilen
  • Umsetzung der ausgewählten Architektur in Azure
  • Aufsetzung eines ETL-Prozesses zur Verschiebung und Transformation der Daten von lokalen Oracle-Datenbanken in eine Azure SQL Datenbank mit Azure Data Factory

Azure SQL DB Azure Data Factory Azure Data Studio PowerPoint Power BI Dataverse SharePoint AAD ADLS Azure Data Studio
LGI Logistics Group International GmbH
München
7 Monate
2022-05 - 2022-11

Ähnlichkeitsanalyse und Clustering von Sachnummern im Einkauf mit KI

KI Entwickler Scikit-learn Keras Tensorflow ...
KI Entwickler

  • Import und Vorbereitung der verschiedenen Datenquellen
  • Ähnlichkeitsanalyse basierend auf der Produktbezeichnung mit NLP
  • Erstellung einer Ähnlichkeitstabelle zum Vergleich der Sachnummern mit mehreren Parametern
  • Entwicklung eines neuronalen Netzes zur Prädiktion eines Ähnlichkeitswertes zwischen Sachnummern
  • Implementierung eines Algorithmus zur Identifikation von Clustern mit ähnlichen Produkten
  • Berechnung des Referenzpreises und Einsparungspotenzial für jedes Cluster
  • Generierung und Export einer Datei mit den Ergebnissen des ClusterAlgorithmus
  • Aufsetzung einer Schnittstelle zum Weiter- oder Neu-Trainieren des neuronalen Netzes mit Anwender-Feedback
  • Deployment des KI-Modells innerhalb der AWS-Umgebung
  • Einsparpotenzial für BMW von über 100 Mio. ? pro Jahr

Scikit-learn Keras Tensorflow Jupyter Git AWS SonarQube Python (Pandas NumPy Nltk itertools Tensorflow) Jupyter Notebooks Python AWS IAM AWS S3 AWS EC2
BMW AG
München
8 Monate
2022-03 - 2022-10

Analyse von Fahrdaten zur Ermittlung des Elektrifizierungspotenzials von LKWs

Data Scientist Python Here Maps API Plotly ...
Data Scientist

  • Identifizierung der Schicht- und Standzeiten von LKWs anhand von TrackingDaten
  • Untersuchung der Points of Interest in der Umgebung von Standorten der LKWs mithilfe der Here Maps API
  • Ermittlung der optimalen Anzahl und Orte für Ladestationen von Elektroautos
  • Implementierung von Algorithmen zur Bestimmung der elektrifizierbaren LKWs auf Basis der fahrspezifischen Daten
  • Entwicklung eines Dashboards mit Plotly Dash zur Analyse des Fahrverhaltens und des Elektrifizierungspotenzials
  • Dokumentation der Algorithmen in Confluence

Python Here Maps API Plotly Dash PyInstaller Jupyter Visual Studio Code Jira Atlassian Confluence Git AWS S3 AWS EC2
MAN Truck & Bus SE
München
8 Monate
2021-07 - 2022-02

Personalvermittlung mit KI

Data Scientist Scikit-learn Plotly Dash ...
Data Scientist

  • Automatisierte Aufbereitung von Stellenausschreibungen und Speicherung in einer MongoDB durch die Aufsetzung eines ETL-Prozesses mit Python
  • Implementation eines intelligenten Algorithmus zur Selektion der optimalen Kontaktdaten für eine Vakanz
  • Implementation von Web-Crawlern für Kandidatenprofile auf Linkedin und Xing
  • Entwicklung von Machine Learning Modellen zur automatisierten Identifikation von passenden Vakanzen für einen Kandidaten
  • Erstellung einer R-Shiny Web App zur statistischen Auswertung von psychologischen Daten
  • Mustererkennung und Implementierung von psychologischen Modellen
  • Aufsetzung eines Python-Dashboards zur Marktanalyse mit Geo Heatmaps, Zeitreihenanalyse und Machine Learning Vorhersagen
  • Auswertung der gesendeten E-Mails und Webhooks zur Optimierung der Response-Rate
  • Anwendung von maschinellen Lernverfahren zur Prädiktion der Request- und Blacklist-Wahrscheinlichkeit, bevor die Präsentation eines Kandidaten an ein Unternehmen gesendet wird
  • Entwicklung von CI/CD Pipelines mit Git und Slackbot Integration

Scikit-learn Plotly Dash Jupyter Heroku R Shiny R Studio AWS S3 MongoDB Mongo Cloud Jira Atlassian Git Linux Python (Scikit-learn Selenium Plotly Dash) AWS S3 Jupyter Notebooks PyCharm Python R Shiny AWS IAM
auf Anfrage
Düsseldorf
5 Monate
2021-02 - 2021-06

Einsatz von Data Science im Fußball

Python Scikit-learn Keras ...
  • Masterarbeit- Das Projektziel besteht in der Entwicklung von Ansätze zum Einsatz von Data Science im Fußball, um die eigene Mannschaftsleistung zu verbessern, eine möglichst genaue Gegneranalyse durchzuführen und neue Spieler oder Talente zu entdecken. Der genutzte Datensatz von StatsBomb enthält Event-Daten zu 879 Fußballspielen, welche als json-Dateien vorliegen und Aktionen wie Pässe, Schüsse, Zweikämpfe, Dribblings, Foulspiele oder Standardsituationen beschreiben


Vorgehen

  • Entwicklung eines Expected Goals Modell zur Prädiktion der Trefferwahrscheinlichkeit eines Torschusses im Fußball mithilfe von Machine Learning
  • Nutzung des Expected Goals Modell zum Scouting von besonders guten Torjägern, Torvorbereitern und Torhütern.
  • Analyse der Entstehung von Toren, indem gefährliche Spielfeldzonen für Torschüsse und Torvorlagen identifiziert sowie verschiedene Angriffsmuster und Standardsituationen ausgewertet wurden.
  • Evaluation der Genauigkeit und Effektivität des Passspiels einzelner Spieler.
  • Untersuchung von Passverbindungen und Passrichtungen, um Passnetzwerke zwischen den Spielfeldzonen und Spielern einer Mannschaft zu erkennen.
  • Statistische Ermittlung des Spielsystems von Mannschaften durch die Auswertung des Positionsspiels der einzelnen Spieler und die Ableitung eine realtaktische Aufstellung.
  • Erstellung von Spielerprofilen, welche zur Kaderzusammenstellung sowie zur Entwicklung eines passenden Spielsystems genutzt werden können.


Resultate:

  • Mithilfe der entwickelten Methoden kann das Angriffsspiel, Passspiel und Spielsystem der eigenen Mannschaft analysiert und optimiert werden. Zudem eignen sich diese Verfahren zur gezielten Gegneranalyse und zum Spielerscouting sowohl bei der Entdeckung von Talenten oder unterbewerteten Spielern als auch bei der passenden Zusammenstellung des Kaders.

Python Scikit-learn Keras TensorFlow Jupyter Notebooks R foci R Studio Plotly Dash
1 Jahr 4 Monate
2020-03 - 2021-06

Analyse von E-Mails mit NLP-Techniken

Data Scientist Python Scikit-learn Statsmodels ...
Data Scientist

  • Analyse des E-Mail-Verkehrs eines Unternehmens zur Identifizierung des Zeitpunktes, an dem sich intern eine Insolvenz abgezeichnet hat
  • Extraktion der Informationen aus einem Terrabyte an E-Mails im PST-Format und Abspeicherung in einer SQL-Datenbank
  • Entwicklung eines ML-Modells zur Extraktion der Signatur von E-Mails
  • Generierung von E-Mail-Flussdiagrammen und Chord-Diagrammen zur Darstellung der Kommunikationswege zwischen den Angestellten
  • Sentimentanalyse zur Auswertung der Stimmung innerhalb der Organisation im zeitlichen Verlauf
  • Topic Modeling zur Aufdeckung von Themen und Gruppierung von E-Mails in verschiedene Themengebiete
  • Entwicklung eines Klassifikationsmodells zur Detektion von rechtlich relevanten E-Mails

Python Scikit-learn Statsmodels Seaborn Jupyter SQL SSMS Hadoop Microsoft Power BI Microsoft Teams SharePoint Git Pypff Langdetect Graphviz Bokeh SQLAlchemy pyodbc NLTK spaCy Microsoft SQL Server Jupyter Notebooks Python (Pypff BERT)
Anwaltskanzlei
Düsseldorf
1 Jahr 4 Monate
2020-03 - 2021-06

Beratung von Unternehmen in Krisensituationen

Data Scientist Python Scikit-learn Statsmodels ...
Data Scientist
  • Entwicklung von Feature Selection Verfahren zur Preistreiberanalyse
  • Analyse des Quote-to-Cash Prozesses zur Optimierung eines Supply Chain Managements
  • Analyse und Auswertung von Finanzbuchhaltungsdaten
Python Scikit-learn Statsmodels Seaborn Jupyter SQL SSMS Hadoop Microsoft Power BI Microsoft Teams SharePoint Git
INSO Projects GmbH
Düsseldorf
3 Monate
2020-11 - 2021-01

Feature Selection Verfahren zur Preistreiberanalyse

Python NumPy Pandas ...

  • Seminararbeit - Ziel dieser Arbeit ist es einige Feature Selection Verfahren auf verschiedenen Datensätzen mit unterschiedlichen ML-Modellen zur Preistreiberanalyse zu evaluieren. Dabei werden sowohl suchbasierte als auch korrelationsbasierte Feature Selection Verfahren hinsichtlich der Reduzierung der Anzahl an Features und der erzielten Vorhersagegenauigkeit untersucht


Vorgehen:

  • Untersuchung von korrelationsbasierten und suchbasierten Feature Selection Verfahren sowie Embedded-Methoden und Principal Component Analysis Implementierung verschiedener Feature Selection Methoden in Python Anwendung der Feature Selection Verfahren auf vier Datensätzen zur Preistreiberanalyse Entwicklung von ML-Modellen zur Prädiktion von Auto- und Immobilienpreisen Evaluation der Feature Selection Verfahren anhand der Ergebnisse der ML-Modelle


Resultate:

  • Die Wahl des Feature Selection Verfahrens ist abhängig vom Datensatz, ML-Modell und Projektziel, sodass es kein standardisiertes Verfahren zur Feature Selection gibt. Allerdings lässt sich aus den Projektergebnissen folgern, dass die suchbasierten Feature Selection Methoden jeweils sehr ähnliche Ergebnisse liefern. Die Feature Extraction durch PCA führt zur stärksten Dimensionsreduktion, aber auch zu schwächeren Vorhersagegenauigkeiten. Zudem ist die Wahl des Feature Selection Verfahrens umso wichtiger, je weniger Zeilen im Datensatz vorliegen und je höher die Modellkomplexität ist.

Python NumPy Pandas Scikit-learn Statsmodels SciPy Matplotlib Seaborn
10 Monate
2018-11 - 2019-08

Entwicklung einer Desktopanwendung zur Finanz- und Personalverwaltung

Mathematisch-technischer Softwareentwickler C# WPF Visual Studio ...
Mathematisch-technischer Softwareentwickler
  • Implementation des Backends und Frontends einer Desktopanwendung mit C# und WPF
  • Management der SQL-Datenbank
  • Migration der Daten aus einer SAP-Datenbank
C# WPF Visual Studio SQL SAP Git YouTrack
Cybernetics Lab IMA & IfU - RWTH Aachen
Aachen
2 Jahre 3 Monate
2016-09 - 2018-11

Implementation einer Webplattform zur Fabrikplanung, Cybernetics Lab IMA & IfU

Mathematisch-technischer Softwareentwickler Java Spring Hibernate ...
Mathematisch-technischer Softwareentwickler
  • Implementation des Java-Backends mit Spring und Hibernate
  • Management der SQL-Datenbank
  • Entwicklung und Optimierung der Datenmodelle
  • Evaluation, Aufsetzung and Datenmigration zu einer NoSQL-Datenbank zur Performancesteigerung (MongoDB, Neo4j)
  • Aufsetzung von CI/CD Pipelines mit automatisierten Unit Tests, Maven Build Prozessen und Deployments auf einem Linux-Server
  • Implementation und Anbindung eines Python-Backends für Deep Learning mit Tensorflow
Java Spring Hibernate Postman SQL MySQL Workbench MongoDB Neo4j Python Tensorflow Git JUnit IntelliJ IDEA YouTrack MySQL Workbench IntelliJ IDEA
Cybernetics Lab IMA & IfU - RWTH Aachen
Aachen

Aus- und Weiterbildung

Aus- und Weiterbildung

3 Monate
2025-03 - 2025-05

AWS Certified Machine Learning ? Specialty

Amazon Web Services
Amazon Web Services
3 Monate
2025-02 - 2025-04

MongoDB Associate Data Modeler

MongoDB
MongoDB
7 Monate
2024-10 - 2025-04

AWS Certified Solutions Architect ? Professional

Amazon Web Services
Amazon Web Services
3 Monate
2025-01 - 2025-03

MongoDB Associate Developer

MongoDB
MongoDB
4 Monate
2024-11 - 2025-02

AWS re/Start Accredited Instructor

Amazon Web Services
Amazon Web Services
3 Monate
2024-08 - 2024-10

AWS Certified Solutions Architect ? Associate

Amazon Web Services
Amazon Web Services
5 Monate
2024-01 - 2024-05

Fabric Analytics Engineer Associate

Microsoft
Microsoft
4 Monate
2023-11 - 2024-02

Power BI Data Analyst Associate

Microsoft
Microsoft
5 Monate
2023-07 - 2023-11

Databricks Certified Data Engineer Associate

Databricks
Databricks
6 Monate
2023-02 - 2023-07

TensorFlow Developer Certificate

Google
Google
3 Monate
2022-12 - 2023-02

AWS Certified Cloud Practitioner

Amazon Web Services
Amazon Web Services
3 Monate
2022-11 - 2023-01

Azure Data Scientist Associate

Microsoft
Microsoft
4 Monate
2022-04 - 2022-07

Azure Data Engineer Associate

Microsoft
Microsoft
1 Jahr 11 Monate
2019-09 - 2021-07

Angwandte Mathematik und Informatik

Master of Science, FH Aachen
Master of Science
FH Aachen
  • Statistik
  • Machine Learning
  • Data Science
  • Masterarbeit: auf Anfrage, Note: 1,0
3 Jahre
2016-08 - 2019-07

Scientific Programming

Bachelor of Science, FH Aachen
Bachelor of Science
FH Aachen

  • Dualer Bachelor-Studiengang in Mathematik und Informatik mit einer Ausbildung zum Mathematisch-technischen Softwareentwickler
  • Zertifizierung zum DataScienceMATSE
  • Bachelorarbeit: auf Anfrage , Note: 1,3

3 Jahre
2016-08 - 2019-07

DataScienceMATSE

FH Aachen
FH Aachen
Abschluss von 3 Data Science Modulen und Verfassung einer Bachelorarbeit im Data Science Bereich

Position

Position

  • Data Scientist
  • AI Developer
  • Data Engineer
  • Cloud Architect

Kompetenzen

Kompetenzen

Top-Skills

Python Azure TensorFlow R SQL PySpark Scikit-learn MLflow Langchain FastAPI Airflow MongoDB Databricks MS Fabric Power BI Plotly Dash Streamlit Git Docker AWS Terraform OpenAI

Schwerpunkte

Azure
Experte
Databricks
Fortgeschritten
MS Fabric
Experte
AWS
Experte
Power BI
Experte

Beratungsschwerpunkte:

  • Data Science: Entwicklung von KI-Modellen mit Machine & Deep Learning, NLP, LLMs, Computer Vision, Datenvisualisierung, Mustererkennung
  • Data Engineering: Architektur und Implementierung von Datenpipelines, Konzeption und Aufbau einer Cloud Infrastruktur
  • Data Analytics: Datenanalyse, Dashboard Erstellung, Webentwicklung
  • Tools: Python, Spark, SQL, R, TensorFlow, Azure, AWS, Databricks, MS Fabric, Power BI, Git, Docker

Produkte / Standards / Erfahrungen / Methoden

IT-Kompetenz:

  • Frameworks: NumPy, Pandas, Scikit-learn, TensorFlow, Keras, MLflow, Seaborn, Statsmodels, OpenAI, Langchain, FastAPI, Airflow
  • Visualisierungstools: Power BI, Tableau, Plotly Dash, Streamlit, R Shiny
  • Azure Data Factory, Azure Synapse, Azure Functions, Azure Cosmos DB
  • MS Fabric (Delta Lake, Lakehouse, One Lake, Spark Notebooks)
  • AWS (IAM, S3, EC2, SageMaker, Glue, Lambda, CloudFormation, ?)
  • Databricks
  • Terraform
  • Docker
  • Confluence, Jira Atlassian, Azure DevOps, Git
  • Linux, Heroku


Fach- und Methodenkompetenz:

Fachlich:

  • ETL (Business Intelligence & Analytics)
  • Datenvorverarbeitung
  • Datenanalyse
  • Machine Learning
  • Deep Learning
  • Feature Engineering & Selection
  • Mustererkennung
  • Natural Language Processing
  • Large Language Modelle
  • Computer Vision
  • Datenvisualisierung
  • Web Crawling
  • Webentwicklung
  • Statistik


Methodisch:

  • Projektplanung
  • Prozessmanagement
  • Agile Methoden, Scrum
  • DevOps, MLOps
  • Schnittstellenkonzeption und -betreuung
  • Integration und Migration
  • Analytisches Denken und Handeln
  • Planungs- und Organisationsfähigkeit
  • Prozessoptimierung und -automatisierung
  • Reports und Dashboards


Beruflicher Werdegang:

06/2024 - heute:

Rolle: Freelancer (Data Scientist & Engineer)


Aufgaben:

  • Entwicklung eines Large Language Modells mit Q&A Webapp
  • Dozent für eine 6-monatige AWS-Schulung


03/2022 - 05/2024:

Rolle: Data Engineer & Scientist

Kunde: Datalytics GmbH


Aufgaben:

  • Entwicklung einer KI zur Ähnlichkeitsanalyse von Produkten im Einkauf bei einem Automobilhersteller, Einsparungspotenzial: > 100 Mio. ? p. a.
  • Entwicklung von Cloud-Architekturen in Azure


07/2021 - 02/2022:

Rolle: Data Scientist

Kunde: IAM Global GmbH


Aufgaben:

  • Entwicklung eines Systems zur Personalvermittlung, welches mithilfe von künstlicher Intelligenz und psychologischen Modellen möglichst passende Vakanzen für einen Kandidaten findet


03/2020 - 06/2021:

Rolle: Werkstudent Data Science

Kunde: INSO Projects GmbH


Aufgaben:

  • Natural Language Processing zur E-Mail-Analyse
  • Analyse und Optimierung der Supply Chain

09/2016 - 08/2019:

Rolle: Softwareentwickler

Kunde: Cybernetics Lab IMA & IfU


Aufgaben:

  • Entwicklung einer Webplattform zur Fabrikplanung
  • Erstellung einer Desktopanwendung zur Finanz- & Personalverwaltung

Programmiersprachen

Python
Experte
R
Experte
SQL
Experte
Java
Experte
PySpark
Experte
C#
Fortgeschritten
Python-Bibliotheken
NumPy, Pandas, Scikit-learn, TensorFlow, Keras, MLflow, Seaborn, Statsmodels, OpenAI, Langchain, FastAPI, Airflow, Streamlit, Plotly, Dash
SAS

Datenbanken

MySQL
Experte
Oracle
Fortgeschritten
MongoDB
Experte
Pinecone
Fortgeschritten
Azure Cosmos DB
Experte
Delta Lake
Experte
DynamoDB
Fortgeschritten
ChromaDB

Branchen

Branchen

  • Automobil
  • Logistik
  • Medien
  • Personalvermittlung
  • Forschung

Vertrauen Sie auf Randstad

Im Bereich Freelancing
Im Bereich Arbeitnehmerüberlassung / Personalvermittlung

Fragen?

Rufen Sie uns an +49 89 500316-300 oder schreiben Sie uns:

Das Freelancer-Portal

Direktester geht's nicht! Ganz einfach Freelancer finden und direkt Kontakt aufnehmen.