Data Scientist/ Data Engineer ? Machine learning, ETL, DWH and BI ? AWS & Azure zertifiziert
Aktualisiert am 02.02.2024
Profil
Freiberufler / Selbstständiger
Remote-Arbeit
Verfügbar ab: 02.02.2024
Verfügbar zu: 100%
davon vor Ort: 20%
Python
SQL
Machine Learning
Splunk Enterprise
Tableau
PowerBI
Amazon QuickSight
Azure
Google Analytics
Google Ads
Google Cloud Platform
AWS
PostgreSQL
Jupyter Notebook
Git
Atlassian JIRA
Scrum
MATLAB
Time Series Analysis
Deutsch
Muttersprache
Farnzösisch
Muttersprache
Englisch
Fließend

Einsatzorte

Einsatzorte

Frankfurt am Main (+50km)
Deutschland
möglich

Projekte

Projekte

1 Jahr 9 Monate
2022-04 - 2023-12

Monitoring, Wartung & Integration von ETL-Strecken ins DWH (Finanzsektor)

Data Engineer, technischer Leiter Python SQL Git
Data Engineer, technischer Leiter
  • Update der Google Analytics UA-API zur neuen GA4-API
  • Major Upgrade der bestehenden EC2-Instanz und Datenbank-Architektur
  • Update der Google Adwords-API zur neuen Google Ads-API (v10)
  • Implementierung und Integration von ETL-Workflows mit AWS Step Functions und Lambda via Cloudformation
  • ETL-Workflow Monitoring
  • Dokumentation und Projektmanagement
AWS PostgreSQL Atlassian Confluence Atlassian JIRA
Python SQL Git
11 Monate
2022-09 - 2023-07

Analyse von eSIM-Daten und Entwicklung eines Datenkonzepts (Telekommunikation)

Data Science Consultant Python SQL
Data Science Consultant

Ziel:

Ziel des Projekts liegt auf der Analyse der verfügbaren eSIM-Daten und der Entwicklung eines Datenkonzepts, um wertvolle Daten zu extrahieren und mögliche Serviceverbesserungen zu bewerten.

Aufgaben:

  • Analyse der verfügbaren Datenlandschaft (Loggingdaten, SMDP+ Reporting Daten)
  • Definition von relevanten KPIs für den eSIM-Service
  • Bewertung der Datenqualität:
    • Datenanalyse, Ermittlung systematischer Fehler
    • Definition von Verbesserungsansätzen
    • Kommunikation mit Datenbesitzern (eSIM-Kartenhersteller) und Entwickler-Team
  • Harmonisierung der unterschiedlichen Datenquellen (Konzeption, Architektur & Auftragserstellung)
  • Konzeption und Implementierung von KPI- & Monitoring-Dashboards für interne und externe Stakeholder
  • Dokumentation
Google Cloud Tableau Splunk Enterprise
Python SQL
2 Monate
2022-02 - 2022-03

Detektion von Fraud-Accounts (Crowdsourcing-Plattform)

Data Science Consultant Python Git CRISP-DM
Data Science Consultant

Ziel:

Ziel des Projekts ist die Detektion und Analyse von potenziellen Fraud Accounts (z.B. Spammern, Bots) mit Hilfe von Machine Learning Verfahren.

Aufgaben:

  • Ermittlung von statistisch relevanten KPI?s
  • Konzeption eines PoCs zur Fraud-Detektion
  • Implementierung und Analyse von Machine Learning-Verfahren zur Fraud-Detektion:
    • Clustering-Verfahren (Hierarchical Clustering, DBSCAN)
    • Supervised Verfahren (Random Forest)
  • Detektion und Analyse von Fraud Accounts
Python Git CRISP-DM
7 Monate
2019-10 - 2020-04

Entwicklung von Fehlerdiagnosemodellen / ETL-Prozess für Full Flight Daten (Luftfahrt)

Predictive Maintenance Engineer MATLAB SQL CRISP-DM
Predictive Maintenance Engineer

Optimierung von Fehlerdiagnosemodellen

Ziel:

Die Analysten vom Engine Condition Monitoring überwachen Kurz- und Langzeittrends von Triebwerksdaten und leiten bei kritischem Befund Wartungsprozesse ein. Aufgrund der Vielzahl an Triebwerken und der Masse an Daten ist eine tägliche Untersuchung aller Zustandsdaten nicht praktikabel. Aus diesem Grund werden Alarmregeln definiert, die bei Überschreitung definierter Schwellwerte oder bei Detektion von Anomalien einen Alarm generieren. Diese Alarmregeln werden wiederum individuell für alle verfügbaren Zustandsdaten definiert. Dabei ist die präzise Definition der Alarmregeln entscheidend für die optimale Balance zwischen einer engmaschigen Überwachung des Triebwerkszustandes und dem zusätzlichen Aufwand der Analysten.
Ziel ist es am Beispiel der Vibrationsdaten die Eignung von Data Mining Verfahren zu untersuchen und mit den bisher genutzten Alarmregeln zu vergleichen.

Aufgaben:

  • Entwicklung eines Fehlerdiagnosemodells
  • Prozessdiagramm
  • Datenakquise
  • Implementierung des Modells in Matlab (Preprocessing, Train-Test-Split, Training, Test)
  • Entwicklung von Metriken und Vergleich mit den bisher eingesetzten Regeln
  • Visualisierung der Ergebnisse (Kennzahlen-Diagramme und Trendverläufe)
  • Präsentation und Diskussion von Zwischenergebnissen mit Analysten, Ingenieuren und Data Scientists


ETL-Prozess für Full Flight Daten

Ziel:

Aufgrund der beschränkten Übertragungsmöglichkeit von Daten im Flugverkehr durchlaufen Flugdaten einen Vorverarbeitungsprozess. Durch diesen Vorverarbeitungsprozess geht eine Vielzahl an wichtigen Informationen verloren. Aus diesem Grund ist ein Zukunftsprojekt hochfrequente Daten (Full Flight Daten) zu nutzen.
Ziel des Projekts war die Entwicklung eines ETL-Prozesses.

Aufgaben:

  • Extraktion der relevanten Daten aus verschiedenen csv-Dateien
  • Transformation der Daten
  • Laden der formatierten Daten auf dem SQL-Server
MySQL Oracle Oracle SQL Developer Strahltriebwerk MS Office
MATLAB SQL CRISP-DM

Aus- und Weiterbildung

Aus- und Weiterbildung

1 Monat
2023-11 - 2023-11

Microsoft Certified: Azure Data Scientist Associate (DP-100)

Microsoft
Microsoft

Bewertete Qualifikationen:

  • Entwerfen und Vorbereiten einer Machine Learning-Lösung
  • Untersuchen von Daten und Trainieren von Modellen
  • Vorbereiten eines Modells für die Bereitstellung
  • Bereitstellen und erneutes Trainieren eines Modells

Nachweis:

[URL auf Anfrage]

1 Monat
2023-09 - 2023-09

AWS Certified Cloud Practitioner (CLF-C01)

AWS
AWS

Die Prüfung zum AWS Certified Cloud Practitioner bestätigt grundlegende, umfassende Kenntnisse der AWS Cloud, der Services und der Terminologie.


Nachweis:

[URL auf Anfrage]

1 Monat
2022-04 - 2022-04

Professional Scrum Product Owner 1 (PSPO 1)

Scrum.org
Scrum.org

Bewertete Qualifikationen:

  • Das Scrum Framework verstehen und anwenden:
    Empirismus, Scrum-Team, Ereignisse, Artefakte, Definiton of Done
  • Entwicklung von Menschen und Teams:
    Selbstverwaltende Teams
  • Produkte mit Agilität verwalten:
    Prognose und Release-Planung, Produktvision, Produktwert, Product Backlog Management, Geschäftsstrategie, Stakeholder und Kunden

Nachweis:

[URL auf Anfrage]

1 Monat
2022-04 - 2022-04

Professional Scrum Master 1 (PSM 1)

Scrum.org
Scrum.org

Bewertete Qualifikationen:

  • Das Scrum Framework verstehen und anwenden:
    Empirismus, Scrum-Werte, Scrum-Team, Ereignisse, Artefakte, Definiton of Done
  • Entwicklung von Menschen und Teams:
    Selbstverwaltende Teams, Moderation, Coaching und Mentoring
  • Produkte mit Agilität verwalten:
    Prognose und Release-Planung, Produktwert, Product Backlog Management, Stakeholder und Kunden

Nachweis:

[URL auf Anfrage]
1 Monat
2022-01 - 2022-01

Microsoft Certified: Azure Data Fundamentals

Microsoft
Microsoft

Bewertete Qualifikationen:

  • Beschreiben wichtiger Datenkonzepte
  • Identifizieren von Überlegungen zu relationalen Daten in Azure
  • Beschreiben von Überlegungen zum Arbeiten mit nicht relationalen Daten in Azure
  • Erklären einer Analyseworkload in Azure

Nachweis:

[URL auf Anfrage]

4 Jahre 1 Monat
2016-10 - 2020-10

Maschinenbau

Master of Science, TU Darmstadt
Master of Science
TU Darmstadt
? Vertiefungsschwerpunkt Luftfahrttechnik
? Thesis: ?Implementierung und Vergleich datenbasierter Ansätze zur Zustandsüberwachung von Triebwerken? (Note: 1,3). In Kooperation mit der Lufthansa Technik AG

? Projekte:

- Advanced Design Project: ?Entwicklung eines robusten TDLAS-Sensors?

- Advanced Research Project: ?Fusion von konfliktbehafteten Daten in technischen Systemen?

Position

Position


Kompetenzen

Kompetenzen

Top-Skills

Python SQL Machine Learning Splunk Enterprise Tableau PowerBI Amazon QuickSight Azure Google Analytics Google Ads Google Cloud Platform AWS PostgreSQL Jupyter Notebook Git Atlassian JIRA Scrum MATLAB Time Series Analysis

Produkte / Standards / Erfahrungen / Methoden

AWS
Fortgeschritten
Azure
Fortgeschritten
Google Cloud
Basics
Git
Basics
Jira/Confluence
Basics
CRISP-DM
Fortgeschritten
SCRUM
Basics
Spyder
Pycharm
Jupyter Notebook
VSCode

Profil:

  • Zertifizierter Data Scientist mit 4+ Jahren Erfahrungen in den Bereichen Data Science, Data Engineering und BI sowie umfangreichen Kenntnissen in den Branchen Maschinenbau, Luftfahrt, Bankwesen und Telekommunikation
  • Zusätzlich praktische Erfahrungen in Cloud-Umgebungen, relationalen Datenbanken inkl. DWH und ETL-Strecken
  • Besonderer Fokus liegt auf der Interpretierbarkeit und Transparenz von Ergebnissen

Programmiersprachen

Python
Experte
Matlab
Fortgeschritten

Datenbanken

SQL
Experte
PostgreSQL
Experte
Google BigQuery
Fortgeschritten
mySQL
Fortgeschritten

Datenkommunikation

Tableau
Fortgeschritten
Splunk Enterprise
Fortgeschritten
Microsoft Power BI
Basics
Quicksight
Basics

Branchen

Branchen

  • Maschinenbau
  • Luftfahrt
  • Banken & Finanzdienstleistungen
  • Telekommunikation
  • Crowdsourcing

Einsatzorte

Einsatzorte

Frankfurt am Main (+50km)
Deutschland
möglich

Projekte

Projekte

1 Jahr 9 Monate
2022-04 - 2023-12

Monitoring, Wartung & Integration von ETL-Strecken ins DWH (Finanzsektor)

Data Engineer, technischer Leiter Python SQL Git
Data Engineer, technischer Leiter
  • Update der Google Analytics UA-API zur neuen GA4-API
  • Major Upgrade der bestehenden EC2-Instanz und Datenbank-Architektur
  • Update der Google Adwords-API zur neuen Google Ads-API (v10)
  • Implementierung und Integration von ETL-Workflows mit AWS Step Functions und Lambda via Cloudformation
  • ETL-Workflow Monitoring
  • Dokumentation und Projektmanagement
AWS PostgreSQL Atlassian Confluence Atlassian JIRA
Python SQL Git
11 Monate
2022-09 - 2023-07

Analyse von eSIM-Daten und Entwicklung eines Datenkonzepts (Telekommunikation)

Data Science Consultant Python SQL
Data Science Consultant

Ziel:

Ziel des Projekts liegt auf der Analyse der verfügbaren eSIM-Daten und der Entwicklung eines Datenkonzepts, um wertvolle Daten zu extrahieren und mögliche Serviceverbesserungen zu bewerten.

Aufgaben:

  • Analyse der verfügbaren Datenlandschaft (Loggingdaten, SMDP+ Reporting Daten)
  • Definition von relevanten KPIs für den eSIM-Service
  • Bewertung der Datenqualität:
    • Datenanalyse, Ermittlung systematischer Fehler
    • Definition von Verbesserungsansätzen
    • Kommunikation mit Datenbesitzern (eSIM-Kartenhersteller) und Entwickler-Team
  • Harmonisierung der unterschiedlichen Datenquellen (Konzeption, Architektur & Auftragserstellung)
  • Konzeption und Implementierung von KPI- & Monitoring-Dashboards für interne und externe Stakeholder
  • Dokumentation
Google Cloud Tableau Splunk Enterprise
Python SQL
2 Monate
2022-02 - 2022-03

Detektion von Fraud-Accounts (Crowdsourcing-Plattform)

Data Science Consultant Python Git CRISP-DM
Data Science Consultant

Ziel:

Ziel des Projekts ist die Detektion und Analyse von potenziellen Fraud Accounts (z.B. Spammern, Bots) mit Hilfe von Machine Learning Verfahren.

Aufgaben:

  • Ermittlung von statistisch relevanten KPI?s
  • Konzeption eines PoCs zur Fraud-Detektion
  • Implementierung und Analyse von Machine Learning-Verfahren zur Fraud-Detektion:
    • Clustering-Verfahren (Hierarchical Clustering, DBSCAN)
    • Supervised Verfahren (Random Forest)
  • Detektion und Analyse von Fraud Accounts
Python Git CRISP-DM
7 Monate
2019-10 - 2020-04

Entwicklung von Fehlerdiagnosemodellen / ETL-Prozess für Full Flight Daten (Luftfahrt)

Predictive Maintenance Engineer MATLAB SQL CRISP-DM
Predictive Maintenance Engineer

Optimierung von Fehlerdiagnosemodellen

Ziel:

Die Analysten vom Engine Condition Monitoring überwachen Kurz- und Langzeittrends von Triebwerksdaten und leiten bei kritischem Befund Wartungsprozesse ein. Aufgrund der Vielzahl an Triebwerken und der Masse an Daten ist eine tägliche Untersuchung aller Zustandsdaten nicht praktikabel. Aus diesem Grund werden Alarmregeln definiert, die bei Überschreitung definierter Schwellwerte oder bei Detektion von Anomalien einen Alarm generieren. Diese Alarmregeln werden wiederum individuell für alle verfügbaren Zustandsdaten definiert. Dabei ist die präzise Definition der Alarmregeln entscheidend für die optimale Balance zwischen einer engmaschigen Überwachung des Triebwerkszustandes und dem zusätzlichen Aufwand der Analysten.
Ziel ist es am Beispiel der Vibrationsdaten die Eignung von Data Mining Verfahren zu untersuchen und mit den bisher genutzten Alarmregeln zu vergleichen.

Aufgaben:

  • Entwicklung eines Fehlerdiagnosemodells
  • Prozessdiagramm
  • Datenakquise
  • Implementierung des Modells in Matlab (Preprocessing, Train-Test-Split, Training, Test)
  • Entwicklung von Metriken und Vergleich mit den bisher eingesetzten Regeln
  • Visualisierung der Ergebnisse (Kennzahlen-Diagramme und Trendverläufe)
  • Präsentation und Diskussion von Zwischenergebnissen mit Analysten, Ingenieuren und Data Scientists


ETL-Prozess für Full Flight Daten

Ziel:

Aufgrund der beschränkten Übertragungsmöglichkeit von Daten im Flugverkehr durchlaufen Flugdaten einen Vorverarbeitungsprozess. Durch diesen Vorverarbeitungsprozess geht eine Vielzahl an wichtigen Informationen verloren. Aus diesem Grund ist ein Zukunftsprojekt hochfrequente Daten (Full Flight Daten) zu nutzen.
Ziel des Projekts war die Entwicklung eines ETL-Prozesses.

Aufgaben:

  • Extraktion der relevanten Daten aus verschiedenen csv-Dateien
  • Transformation der Daten
  • Laden der formatierten Daten auf dem SQL-Server
MySQL Oracle Oracle SQL Developer Strahltriebwerk MS Office
MATLAB SQL CRISP-DM

Aus- und Weiterbildung

Aus- und Weiterbildung

1 Monat
2023-11 - 2023-11

Microsoft Certified: Azure Data Scientist Associate (DP-100)

Microsoft
Microsoft

Bewertete Qualifikationen:

  • Entwerfen und Vorbereiten einer Machine Learning-Lösung
  • Untersuchen von Daten und Trainieren von Modellen
  • Vorbereiten eines Modells für die Bereitstellung
  • Bereitstellen und erneutes Trainieren eines Modells

Nachweis:

[URL auf Anfrage]

1 Monat
2023-09 - 2023-09

AWS Certified Cloud Practitioner (CLF-C01)

AWS
AWS

Die Prüfung zum AWS Certified Cloud Practitioner bestätigt grundlegende, umfassende Kenntnisse der AWS Cloud, der Services und der Terminologie.


Nachweis:

[URL auf Anfrage]

1 Monat
2022-04 - 2022-04

Professional Scrum Product Owner 1 (PSPO 1)

Scrum.org
Scrum.org

Bewertete Qualifikationen:

  • Das Scrum Framework verstehen und anwenden:
    Empirismus, Scrum-Team, Ereignisse, Artefakte, Definiton of Done
  • Entwicklung von Menschen und Teams:
    Selbstverwaltende Teams
  • Produkte mit Agilität verwalten:
    Prognose und Release-Planung, Produktvision, Produktwert, Product Backlog Management, Geschäftsstrategie, Stakeholder und Kunden

Nachweis:

[URL auf Anfrage]

1 Monat
2022-04 - 2022-04

Professional Scrum Master 1 (PSM 1)

Scrum.org
Scrum.org

Bewertete Qualifikationen:

  • Das Scrum Framework verstehen und anwenden:
    Empirismus, Scrum-Werte, Scrum-Team, Ereignisse, Artefakte, Definiton of Done
  • Entwicklung von Menschen und Teams:
    Selbstverwaltende Teams, Moderation, Coaching und Mentoring
  • Produkte mit Agilität verwalten:
    Prognose und Release-Planung, Produktwert, Product Backlog Management, Stakeholder und Kunden

Nachweis:

[URL auf Anfrage]
1 Monat
2022-01 - 2022-01

Microsoft Certified: Azure Data Fundamentals

Microsoft
Microsoft

Bewertete Qualifikationen:

  • Beschreiben wichtiger Datenkonzepte
  • Identifizieren von Überlegungen zu relationalen Daten in Azure
  • Beschreiben von Überlegungen zum Arbeiten mit nicht relationalen Daten in Azure
  • Erklären einer Analyseworkload in Azure

Nachweis:

[URL auf Anfrage]

4 Jahre 1 Monat
2016-10 - 2020-10

Maschinenbau

Master of Science, TU Darmstadt
Master of Science
TU Darmstadt
? Vertiefungsschwerpunkt Luftfahrttechnik
? Thesis: ?Implementierung und Vergleich datenbasierter Ansätze zur Zustandsüberwachung von Triebwerken? (Note: 1,3). In Kooperation mit der Lufthansa Technik AG

? Projekte:

- Advanced Design Project: ?Entwicklung eines robusten TDLAS-Sensors?

- Advanced Research Project: ?Fusion von konfliktbehafteten Daten in technischen Systemen?

Position

Position


Kompetenzen

Kompetenzen

Top-Skills

Python SQL Machine Learning Splunk Enterprise Tableau PowerBI Amazon QuickSight Azure Google Analytics Google Ads Google Cloud Platform AWS PostgreSQL Jupyter Notebook Git Atlassian JIRA Scrum MATLAB Time Series Analysis

Produkte / Standards / Erfahrungen / Methoden

AWS
Fortgeschritten
Azure
Fortgeschritten
Google Cloud
Basics
Git
Basics
Jira/Confluence
Basics
CRISP-DM
Fortgeschritten
SCRUM
Basics
Spyder
Pycharm
Jupyter Notebook
VSCode

Profil:

  • Zertifizierter Data Scientist mit 4+ Jahren Erfahrungen in den Bereichen Data Science, Data Engineering und BI sowie umfangreichen Kenntnissen in den Branchen Maschinenbau, Luftfahrt, Bankwesen und Telekommunikation
  • Zusätzlich praktische Erfahrungen in Cloud-Umgebungen, relationalen Datenbanken inkl. DWH und ETL-Strecken
  • Besonderer Fokus liegt auf der Interpretierbarkeit und Transparenz von Ergebnissen

Programmiersprachen

Python
Experte
Matlab
Fortgeschritten

Datenbanken

SQL
Experte
PostgreSQL
Experte
Google BigQuery
Fortgeschritten
mySQL
Fortgeschritten

Datenkommunikation

Tableau
Fortgeschritten
Splunk Enterprise
Fortgeschritten
Microsoft Power BI
Basics
Quicksight
Basics

Branchen

Branchen

  • Maschinenbau
  • Luftfahrt
  • Banken & Finanzdienstleistungen
  • Telekommunikation
  • Crowdsourcing

Vertrauen Sie auf Randstad

Im Bereich Freelancing
Im Bereich Arbeitnehmerüberlassung / Personalvermittlung

Fragen?

Rufen Sie uns an +49 89 500316-300 oder schreiben Sie uns:

Das Freelancer-Portal

Direktester geht's nicht! Ganz einfach Freelancer finden und direkt Kontakt aufnehmen.