Freelance Senior Data ScientistPythonNamed Entity RecognitionNatural Language Processing...
Freelance Senior Data Scientist
Identifizierung umsetzbarer KI-Anwendungsfälle.
Extraktion wesentlicher Erkenntnisse aus einem umfangreichen Online-Werbedatensatz durch den Einsatz von Natural Language Processing (NLP) und Named Entity Recognition (NER).
Design der gesamten Architektur und Implementierung der Machine-Learning-Lösung.
Leitung eines Teams von fünf Entwicklern bis zur erfolgreichen Produktbereitstellung in Azure.
NB:Dieses Projekt wurde als eines der fünf innovativsten Projekte des Unternehmens ausgewählt.
spacyAzureAzure DevopsNoSQL
PythonNamed Entity RecognitionNatural Language ProcessingData Science
WBS Training AG
Remote
9 Monate
2022-04 - 2022-12
Optimiertes Routing autonomer Busse durch Reinforcement Learning
Senior Data ScientistPythonstable-baselines3Agile Softwareentwicklung...
Senior Data Scientist
- Leitung der Entwicklung eines Reinforcement Learning-Algorithmus zur Optimierung des Routings von selbstfahrenden Bussen (6 Teammitglieder) - Organisation des Teams in agilen Sprints - Code Reviews
- Entwicklung eines Algorithmus zur Vorhersage von Graffitibesprühungen an Zügen anhand von historischen Meldungen und Zugbewegungsdaten - Fachliche Leitung: Entwicklung eines Reinforcement Learning-basierten Agenten zur Optimierung des Routings autonomer Bussen - Entwicklung eines Algorithmus zur Optimierung von Instandhaltungsarbeiten an Windenergieanlagen - Entwicklung einer Reinforcement Learning Baseline für die Kaggle kore 2022 Competition. Der Beitrag erhielt die meisten Upvotes von anderen Teilnehmer: https://www.kaggle.com/code/lesamu/reinforcement-learning-baseline-in-python/ - Zweiter Community Preis in der ?NeurIPS Flatland challenge: Multi-agent reinforcement learning in complex train networks?: https://www.aicrowd.com/showcase/the-flatland-symphony - Zahlreiche Pitches und Workshops - Erstellung eines firmeninternen "Coffee break bots" als Docker Container mit Slack & Azure
qdive GmbH
München
8 Monate
2021-07 - 2022-02
Vorhersage von Graffitibesprühungen an Zügen
Senior Data ScientistData ScientistMachine LearningPython...
Senior Data Scientist
Ziel des Projektes war, Ort und Zeit von Graffitibesprühungen an Zügen zu vorhersagen. Mit dieser Information könnte die DB Regio durch den Einsatz von Sicherheitspersonal den Schaden verhindern.
Ich habe die Leitung des Projektes übernommen und Machine Learning-Modelle anhand von historischen Meldungen und Zugbewegungsdaten entwickelt. Das beinhaltet: - Data Cleaning & Feature Engineering - Definition von geeigneten Modellmetriken in Abstimmung mit dem Fachbereich - Kontrolle der Datenqualität. Organisation und Durchführung von Fachworkshops, um diese zu erhöhen - Visualisierung von Graffitihotspots und Modellgüte - Präsentation der Ergebnisse vor den Stakeholdern (bis CIO-Level)
Data ScientistMachine LearningPythonGeodatenverarbeitungXGBoostscikit-learnkepler.glVisualisierung
Deutsche Bahn Regio AG
Remote
8 Monate
2020-10 - 2021-05
Optimierung der Planung von Instandhaltungsmaßnahmen an Windenergieanlagen
Senior Data ScientistPythonOptimierungDevOps...
Senior Data Scientist
- Entwicklung und Deployement eines Algorithmus, der eine optimale Terminplanung für die Instandhaltung von Windenergieanlagen erzeugt. Die durch die Ausschaltung der Anlage verursachten Verluste werden minimiert - Definition und Implementierung der Datenstruktur nach OOP-Prinzipien - Code Refactoring inkl. Erstellung von Unit Tests - Enge Kollaboration mit Data Engineers und DevOps Engineers bezüglich des Deployments - Deployment als MS Azure Function
AzureCosmos DBAzure Functions
PythonOptimierungDevOpspytestNoSQLGit
Remote
7 Monate
2019-07 - 2020-01
Prognose von Flugverspätungen
Data ScientistApache SparkMachine LearningPython...
Data Scientist
- Minutengenaue Vorhersage von Flugverspätungen anhand von geographischen Daten - Entwicklung von Machine Learning-Modelle in Python (Random Forests, XGBoost) - Feature Engineering mit pandas und PySpark - Reduzierung der Rechenzeit von Features von Tagen auf Stunden - Die Performance des trainierten ML-Modells übertraf die des zu den Zeitpunkt eingesetzten Modells - Visualisierung der Ergebnisse mit kepler.gl, Plotly und Matplotlib
Apache SparkMachine LearningPythonXGBoost
Deutsche Lufthansa AG
Frankfurt am Main
7 Monate
2019-07 - 2020-01
[Festanstellung] Data Scientist
Data ScientistPySparkApache SparkPython...
Data Scientist
- Minutengenaue Vorhersage von Flugverspätungen anhand von geographischen Daten - Entwicklung von Machine Learning-Modelle in Python (Random Forests, XGBoost) - Feature Engineering mit pandas und PySpark - Reduzierung der Rechenzeit von Features von Tagen auf Stunden - Die Performance des trainierten ML-Modells übertraf die des zu den Zeitpunkt eingesetzten Modells - Visualisierung der Ergebnisse mit kepler.gl, Plotly und Matplotlib
PySparkApache SparkPythonMachine Learning
zeroG GmbH (Lufthansa Gruppe)
Frankfurt am Main
9 Monate
2018-10 - 2019-06
[Festanstellung] Business Data Analyst
Business Data AnalystSQLTableauPython
Business Data Analyst
- Entwicklung eines "Moonshot"-Geschäftsmodells basierend auf Blockchain, Datensouveränität und Alternativen zur Online-Werbung - Erstellung von Berichten und Dashboards in Tableau - Ad-hoc Datenanalysen (SQL, Python)
Freelance Senior Data ScientistPythonNamed Entity RecognitionNatural Language Processing...
Freelance Senior Data Scientist
Identifizierung umsetzbarer KI-Anwendungsfälle.
Extraktion wesentlicher Erkenntnisse aus einem umfangreichen Online-Werbedatensatz durch den Einsatz von Natural Language Processing (NLP) und Named Entity Recognition (NER).
Design der gesamten Architektur und Implementierung der Machine-Learning-Lösung.
Leitung eines Teams von fünf Entwicklern bis zur erfolgreichen Produktbereitstellung in Azure.
NB:Dieses Projekt wurde als eines der fünf innovativsten Projekte des Unternehmens ausgewählt.
spacyAzureAzure DevopsNoSQL
PythonNamed Entity RecognitionNatural Language ProcessingData Science
WBS Training AG
Remote
9 Monate
2022-04 - 2022-12
Optimiertes Routing autonomer Busse durch Reinforcement Learning
Senior Data ScientistPythonstable-baselines3Agile Softwareentwicklung...
Senior Data Scientist
- Leitung der Entwicklung eines Reinforcement Learning-Algorithmus zur Optimierung des Routings von selbstfahrenden Bussen (6 Teammitglieder) - Organisation des Teams in agilen Sprints - Code Reviews
- Entwicklung eines Algorithmus zur Vorhersage von Graffitibesprühungen an Zügen anhand von historischen Meldungen und Zugbewegungsdaten - Fachliche Leitung: Entwicklung eines Reinforcement Learning-basierten Agenten zur Optimierung des Routings autonomer Bussen - Entwicklung eines Algorithmus zur Optimierung von Instandhaltungsarbeiten an Windenergieanlagen - Entwicklung einer Reinforcement Learning Baseline für die Kaggle kore 2022 Competition. Der Beitrag erhielt die meisten Upvotes von anderen Teilnehmer: https://www.kaggle.com/code/lesamu/reinforcement-learning-baseline-in-python/ - Zweiter Community Preis in der ?NeurIPS Flatland challenge: Multi-agent reinforcement learning in complex train networks?: https://www.aicrowd.com/showcase/the-flatland-symphony - Zahlreiche Pitches und Workshops - Erstellung eines firmeninternen "Coffee break bots" als Docker Container mit Slack & Azure
qdive GmbH
München
8 Monate
2021-07 - 2022-02
Vorhersage von Graffitibesprühungen an Zügen
Senior Data ScientistData ScientistMachine LearningPython...
Senior Data Scientist
Ziel des Projektes war, Ort und Zeit von Graffitibesprühungen an Zügen zu vorhersagen. Mit dieser Information könnte die DB Regio durch den Einsatz von Sicherheitspersonal den Schaden verhindern.
Ich habe die Leitung des Projektes übernommen und Machine Learning-Modelle anhand von historischen Meldungen und Zugbewegungsdaten entwickelt. Das beinhaltet: - Data Cleaning & Feature Engineering - Definition von geeigneten Modellmetriken in Abstimmung mit dem Fachbereich - Kontrolle der Datenqualität. Organisation und Durchführung von Fachworkshops, um diese zu erhöhen - Visualisierung von Graffitihotspots und Modellgüte - Präsentation der Ergebnisse vor den Stakeholdern (bis CIO-Level)
Data ScientistMachine LearningPythonGeodatenverarbeitungXGBoostscikit-learnkepler.glVisualisierung
Deutsche Bahn Regio AG
Remote
8 Monate
2020-10 - 2021-05
Optimierung der Planung von Instandhaltungsmaßnahmen an Windenergieanlagen
Senior Data ScientistPythonOptimierungDevOps...
Senior Data Scientist
- Entwicklung und Deployement eines Algorithmus, der eine optimale Terminplanung für die Instandhaltung von Windenergieanlagen erzeugt. Die durch die Ausschaltung der Anlage verursachten Verluste werden minimiert - Definition und Implementierung der Datenstruktur nach OOP-Prinzipien - Code Refactoring inkl. Erstellung von Unit Tests - Enge Kollaboration mit Data Engineers und DevOps Engineers bezüglich des Deployments - Deployment als MS Azure Function
AzureCosmos DBAzure Functions
PythonOptimierungDevOpspytestNoSQLGit
Remote
7 Monate
2019-07 - 2020-01
Prognose von Flugverspätungen
Data ScientistApache SparkMachine LearningPython...
Data Scientist
- Minutengenaue Vorhersage von Flugverspätungen anhand von geographischen Daten - Entwicklung von Machine Learning-Modelle in Python (Random Forests, XGBoost) - Feature Engineering mit pandas und PySpark - Reduzierung der Rechenzeit von Features von Tagen auf Stunden - Die Performance des trainierten ML-Modells übertraf die des zu den Zeitpunkt eingesetzten Modells - Visualisierung der Ergebnisse mit kepler.gl, Plotly und Matplotlib
Apache SparkMachine LearningPythonXGBoost
Deutsche Lufthansa AG
Frankfurt am Main
7 Monate
2019-07 - 2020-01
[Festanstellung] Data Scientist
Data ScientistPySparkApache SparkPython...
Data Scientist
- Minutengenaue Vorhersage von Flugverspätungen anhand von geographischen Daten - Entwicklung von Machine Learning-Modelle in Python (Random Forests, XGBoost) - Feature Engineering mit pandas und PySpark - Reduzierung der Rechenzeit von Features von Tagen auf Stunden - Die Performance des trainierten ML-Modells übertraf die des zu den Zeitpunkt eingesetzten Modells - Visualisierung der Ergebnisse mit kepler.gl, Plotly und Matplotlib
PySparkApache SparkPythonMachine Learning
zeroG GmbH (Lufthansa Gruppe)
Frankfurt am Main
9 Monate
2018-10 - 2019-06
[Festanstellung] Business Data Analyst
Business Data AnalystSQLTableauPython
Business Data Analyst
- Entwicklung eines "Moonshot"-Geschäftsmodells basierend auf Blockchain, Datensouveränität und Alternativen zur Online-Werbung - Erstellung von Berichten und Dashboards in Tableau - Ad-hoc Datenanalysen (SQL, Python)