Data Scientist, spezialisiert auf Machine Learning, Deep Learning, und die Entwicklung maßgeschneiderter, effizienter Algorithmen.
Aktualisiert am 30.08.2023
Profil
Freiberufler / Selbstständiger
Verfügbar ab: 01.01.2022
Verfügbar zu: 100%
davon vor Ort: 100%
Data Science
R
Python
Deutsch
Muttersprache
Englisch
Fließend (C2)
Spanisch
Grundkenntnisse (A2)

Einsatzorte

Einsatzorte

München (+100km) Nürnberg (+50km) Mindelheim (+100km) Erlangen (+100km) Deggendorf (+75km)
nicht möglich

Projekte

Projekte

9 Jahre 3 Monate
2014-12 - heute

Dozententätigkeit

Dozent
Dozent
  • Halten und Weiterentwickeln der Kurse ?Data Science Methodenkurs?
  • ?Praktische Datenanalyse mit R?, und ?Programmieren mit R?
Essential Data Science GmbH, München
1 Jahr 8 Monate
2020-05 - 2021-12

Management und Entwicklung einer Data Pipeline in Palantir Foundry

Cloud Data Engineer Python PySpark Palantir Foundry ...
Cloud Data Engineer
  • Entwicklung einer Datenverarbeitungspipeline die die Wirtschaftlichkeit für Energiekontrakte berechnet
  • Migration eines Datenverarbeitungssystems von Palantir Foundry nach Amazon Web Services
  • Erstellung von Analysen und Reports für Anwender aus dem Handel
Python PySpark Palantir Foundry AWS (Lambda Glue S3 SageMaker) pySpark SQL Azure DevOps
EnBW AG, Karlsruhe
Remote
1 Jahr 8 Monate
2018-08 - 2020-03

End-to-End Deployment

Full Stack Data Scientist, Energy Analytics Python xgboost Spark ...
Full Stack Data Scientist, Energy Analytics
  • End-to-End Deployment eines Prognosemodells für Stromgeneration auf Microsoft Azure
  • Entwickelte Python-Paket für Prognosemodelle von Energieverbrauch von Privathaushalten
  • Entwickelte Modelle zur Anomalieerkennung von ungewöhnlichem Stromverbrauch
Python xgboost Spark Azure Cloud Docker Databricks
E.ON SE, München
4 Monate
2018-04 - 2018-07

Big Data Engineering

AWS Spark Hadoop ...
  • Implementierte eine Datenverarbeitungs-Pipeline, von gelieferten Daten in einen internen Hive-Speicher, mit Spark in Python und R
AWS Spark Hadoop Python Hive Databricks
aifora GmbH
Düsseldorf
4 Monate
2018-04 - 2018-07

Predictive Analytics

Python scikit-learn Jupyter ...

  • Programmierte ein Modell zur automatischen Berechnung von Einstellungen von Fitnessgeräten aufgrund von Körpersegmentlängen

Python scikit-learn Jupyter Scrum/Agile
Milon Care GmbH
11 Monate
2017-05 - 2018-03

Automatische Fehlerkorrektur in Zeitreihen

Data Scientist R RStudio Shiny ...
Data Scientist
Drei Folgeaufträge:
  • Erstellte ein Programm zum automatischen Pricing von Kundenanfragen
  • Entwarf und programmierte einen Algorithmus zur Generierung von Price Forward Curves für Strompreise, von Stunden- bis Monatsgranularität
  • Programmierte eine Shiny-Applikation zur explorativen Einstellung von Parametern für einen Handelsalgorithmus
  • Optimierte die Laufzeit eines R-Programms zum realtime-Pricing von Handelsdaten von 120 Sekunden pro Iteration auf 15 Sekunden
R RStudio Shiny VBA
Trumpf AG
Ditzingen (Remote)
2 Monate
2018-01 - 2018-02

Search Engine Optimization

Amazon Web Services (EC2) R
  • Webseiten-Audit mit sitespeed.io
  • Setup einer AWS-Instanz zum Web-crawling mit Sitebulb
  • Mitarbeit an einem Algorithmus zum automatischen Vorschlagen von Keywords für Webseiten
Amazon Web Services (EC2) R
Artios.io
London (remote)
6 Monate
2017-01 - 2017-06

Mitentwicklung an einem Produktempfehlungssystem

Data Scientist R xgboost
Data Scientist
  • Implementierte einen Algorithmus zur Interpretation von Interaktionen in xgboost-Modellen
  • Benchmarking gegen Warenkorbanalyse / Assoziationsregeln
R xgboost
BASF SE
Ludwigshafen
2 Jahre 3 Monate
2015-04 - 2017-06

Effiziente Parameterschätzung in R

Doktorand Parallel Processing Algorithmenentwicklung Statistik ...
Doktorand
  • Entwarf und programmierte einen laufzeiteffizienten EM-Algorithmus zur Schätzung von Risikoparametern bei Krebspatienten
R Sun Grid Engine
Parallel Processing Algorithmenentwicklung Statistik Cluster Computing
IBE, LMU
München
1 Jahr 6 Monate
2015-08 - 2017-01

Automatisierung wiederkehrender Analysen

Algorithmenentwicklung
  • Entwickelte Skripte zur automatisierten Auswertung quartalsweise wiederkehrender Datenauswertungen
SPSS Python
Algorithmenentwicklung
Ipsos Loyalty GmbH
München
2 Monate
2016-06 - 2016-07

Price Forward Curve für Strompreise

Data Scientist R Parallel Processing Performanceoptimierung ...
Data Scientist


    R Parallel Processing Performanceoptimierung Shiny
    Bayerngas Energy GmbH
    München
    3 Monate
    2015-11 - 2016-01

    Leitung eines Marktforschungsprojekts

    Freiberuflicher Statistiker Statistik Datenanalyse
    Freiberuflicher Statistiker
    • Leitung eines Marktforschungsprojekts
    • Entwurf des Untersuchungsdesigns und anschließende statistische Auswertung und Berichterstellung
    R
    Statistik Datenanalyse
    Sport- und Freizeitparadies GYM 80 GmbH
    3 Monate
    2015-10 - 2015-12

    Datenanalyse für eine Forschungsarbeit

    Freiberuflicher Statistiker RMarkdown Gemischte Lineare Modelle R
    Freiberuflicher Statistiker
    • Entwickelte ein statistisches Prognosemodell für einen Biomarker anhand verschiedener klinischer Parameter
    R
    RMarkdown Gemischte Lineare Modelle R
    Universitätsklinikum, Tirol
    Tirol
    2 Jahre 3 Monate
    2013-10 - 2015-12

    Parallelisierung eines statistischen Modells

    Doktorand Parallel Processing
    Doktorand
    • Parallelisierte via MapReduce-Ansatz ein GAMs (Generalisiertes Additives Modell) in R
    • Reduzierung der Laufzeit statistischer Modelle auf großen Genexpressionsdatensätzen
    R
    Parallel Processing
    Genzentrum, LMU
    München
    2 Monate
    2015-08 - 2015-09

    Statistische Auswertung einer empirischen Studie

    Freiberuflicher Statistiker Datenanalyse
    Freiberuflicher Statistiker
    • Bestimmung relevanter Faktoren auf den Erfolg von frühkindlichen Bildungsprogrammen
    • In Zusammenarbeit mit der Kindernothilfe
    SPSS
    Datenanalyse
    Fakultät für Psychologie und Pädagogik, LMU München
    6 Monate
    2013-04 - 2013-09

    Machine Learning-Vergleichsstudie, Masterarbeit

    Cluster Computing Machine Learning
    • Planung und Durchführung einer Vergleichsstudie von Machine Learning-Algorithmen zur Klassifikation von Reflektanzspektren
    • [URL zur Veröffentlichung auf Anfrage]
    Sun Grid Engine R
    Cluster Computing Machine Learning
    Erlangen
    7 Monate
    2013-03 - 2013-09

    Statistische Beratung von Studierenden und Externen

    Wissenschaftliche Hilfskraft
    Wissenschaftliche Hilfskraft
    Statistisches Beratungslabor
    2 Jahre
    2011-05 - 2013-04

    Programmierung statistischer Lösungen in R und SPSS

    Statistiker Statistik Datenanalyse Algorithmen
    Statistiker

    Programmierung statistischer Lösungen in R und SPSS

    Relevante Projekte:

    • Entwicklung von R-Paketen, -Skripten und Dokumentationen im Bereich Lebensmittelsicherheit für
      das Bundesinstitut für Risikobewertung (BfR)

    • Datenbankentwicklung (MySQL) in einem Projekt zur Berechnung von Wachstums- und Inaktivierungsparametern von mikrobiologischen Modellen
    SPSS R MySQL
    Statistik Datenanalyse Algorithmen
    3 Monate
    2012-03 - 2012-05

    Entwicklung eines Prognosemodells

    R
    • Entwicklung eines Prognosemodells der Benutzerzahlen für eine neue Smartphone-App
    R
    Münchner Start-Up

    Aus- und Weiterbildung

    Aus- und Weiterbildung

    3 Jahre 11 Monate
    2013-10 - 2017-08

    Promotion (Dr. rer. nat)

    Dr.rer.nat, IBE, Ludwig-Maximilians-Universität München
    Dr.rer.nat
    IBE, Ludwig-Maximilians-Universität München

    • Dissertation auf Anfrage

    2 Jahre
    2011-10 - 2013-09

    Master-Studium der Statistik

    Master, Ludwig-Maximilians-Universität, München
    Master
    Ludwig-Maximilians-Universität, München
    • Machine Learning
    3 Jahre
    2008-10 - 2011-09

    Bachelor-Studium der Statistik

    Bachelor, Ludwig-Maximilians-Universität, München
    Bachelor
    Ludwig-Maximilians-Universität, München
    • Nebenfach Informatik
    2 Jahre 11 Monate
    2005-09 - 2008-07

    Ausbildung zum Fachinformatiker

    Fachinformatiker, Bundesamt für Migration und Flüchtlinge, Nürnberg
    Fachinformatiker
    Bundesamt für Migration und Flüchtlinge, Nürnberg
    • Fachrichtung Anwendungsentwicklung

    Position

    Position

    • Data Scientist

    Kompetenzen

    Kompetenzen

    Top-Skills

    Data Science R Python

    Schwerpunkte

    Big Data
    Spark, Databricks, Amazon AWS, Microsoft Azure
    Data Science
    Machine Learning, Deep Learning, maßgeschneiderte Algorithmen
    Deep Learning
    Kommunikation
    Schulungen, anwenderfreundliches Vermitteln von Methoden und Ergebnissen, technisches sowie angewandtes Schreiben
    Machine Learning
    Optimierung
    Laufzeitoptimierung von Programmen und Algorithmen, Automatisierung von komplexen Arbeitsabläufen
    Programmieren
    Python, R, SQL, Linux shell

    Produkte / Standards / Erfahrungen / Methoden

    Algorithmen
    Algorithmenentwicklung
    Apache Spark
    Cloudera
    Cluster Computing
    Sun Grid Engine
    Datenanalyse
    Hadoop
    Cloudera Certified Spark and Hadoop Developer
    Parallel Processing
    in R. Multicore sowie Clusterumgebungen
    Performanceoptimierung
    R
    SPSS
    Statistik
    Promotion in Statistik

    Profil:

    • Ich bin Data Scientist im Bereich Machine Learning, und verbinde ein tiefes mathematisches Verständnis der relevanten Algorithmen mit der Fähigkeit, komplexe Analysen in klarer und umsetzbarer Form zu kommunizieren


    IT-Kenntnisse:

    Machine Learning

    • scikit-learn
    • Keras
    • mlr


    Big Data

    • Spark
    • Databricks


    Cloud Computing

    • Amazon Web Services (AWS)
    • Microsoft Azure


    Sonstiges

    • Git
    • Docker
    • Emacs


    Community & Open-Source:

    ml

    • Machine Learning in R, R-Paket
    • Contributor des R-Pakets mlr. Diverse Erweiterungen und Bugfixes als Pull-Requests auf GitHub


    Deep Learning 

    • Startup Name Generator, auf GitHub
    • Python-Paket zum Generieren von Namensvorschlägen für Unternehmen und Software


    GenoGAM 

    • A GAM based framework for analysis of ChIP-Seq data, Bioconductor-Paket
    • Miterstellung eines R-Pakets zum Berechnen parallelisierter statistischer Modelle auf DNA


    Blogging 

    • Zwei Blogs über Statistik und Machine Learning
    • Link auf Anfrage


    Beruflicher Werdegang:

    2022-11 - 2023-03 

    Rolle: Data Scientist, Shape Risk Management

    Kunde: E.ON SE, Essen


    Aufgaben:

    • Entwicklung browserbasierter interaktiver Risiko-Reports für Shape und Performance einer PFC für Strompreise


    Kenntnisse: 

    Python, streamlit, pandas, Azure DevOps


    2014-12 - heute

    Rolle: Dozent

    Kunde: Essential Data Science GmbH, München


    Aufgaben:

    • Halten und Weiterentwickeln der Kurse ?Data Science Methodenkurs?, ?Praktische Datenanalyse mit R?, und ?Programmieren mit R?


    2020-05 - 2022 -10

    Rolle: Data Engineer, Energy Trading

    Kunde: EnBW AG, Karlsruhe


    Aufgaben:

    • Entwicklung einer Datenverarbeitungspipeline die die Wirtschaftlichkeit für Energiekontrakte berechnet
    • Migration eines Datenverarbeitungssystems von Palantir Foundry nach Amazon Web Services
    • Erstellung von Analysen und Reports für Anwender aus dem Handel


    Kenntnisse:

    Palantir Foundry, AWS (Lambda, Glue, S3, SageMaker), Python, pySpark, SQL, Azure DevOps


    2018-08 - 2020-03

    Rolle: Full Stack Data Scientist, Energy Analytics

    Kunde: E.ON SE, München


    Aufgaben:

    • End-to-End Deployment eines Prognosemodells für Stromgeneration auf Microsoft Azure
    • Entwickelte Python-Paket für Prognosemodelle von Energieverbrauch von Privathaushalten
    • Entwickelte Modelle zur Anomalieerkennung von ungewöhnlichem Stromverbrauch


    Kenntnisse:

    Python, xgboost, Spark, Azure Cloud, Docker, Databricks


    2018-04 - 2018-07

    Rolle: Big Data Engineering

    Kunde: aifora GmbH, Düsseldorf


    Aufgaben:

    • Implementierte eine Datenverarbeitungs-Pipeline, von gelieferten Daten in einen internen Hive-Speicher, mit Spark in Python und R


    Kenntnisse:

    AWS, Spark, Hadoop, Python, Hive, Databricks


    2018-04 - 2018-07

    Kunde:  Milon Care GmbH


    Aufgaben:

    • Predictive Analytics
    • Programmierte ein Modell zur automatischen Berechnung von Einstellungen von Fitnessgeräten aufgrund von Körpersegmentlängen


    Kenntnisse:

    Python, scikit-learn, Jupyter, Scrum/Agile


    2017-05 - 2018-03


    Aufgaben:

    Drei Folgeaufträge:

    • Erstellte ein Programm zum automatischen Pricing von Kundenanfragen
    • Entwarf und programmierte einen Algorithmus zur Generierung von Price Forward Curves für Strompreise, von Stunden- bis Monatsgranularität
    • Programmierte eine Shiny-Applikation zur explorativen Einstellung von Parametern für einen Handelsalgorithmus
    • Optimierte die Laufzeit eines R-Programms zum realtime-Pricing von Handelsdaten von 120 Sekunden pro Iteration auf 15 Sekunden


    Kenntnisse:

    R, RStudio, Shiny, VBA


    2018-01 - 2018-02

    Kunde: Artios.io, London


    Aufgaben:

    • Search Engine Optimization
    • Webseiten-Audit mit sitespeed.io
    • Setup einer AWS-Instanz zum Web-crawling mit Sitebulb
    • Mitarbeit an einem Algorithmus zum automatischen Vorschlagen von Keywords für Webseiten


    Kenntnisse: 

    Amazon Web Services (EC2), R


    2017-05 - 2017-10

    Kunde: Trumpf AG, Ditzingen


    Aufgaben:

    • Automatische Fehlerkorrektur in Zeitreihen
    • Entwickelte einen Algorithmus, der automatisch falsche Werte in Zählerständen erkennt und korrigiert


    Kenntnisse:

    R


    2017-01 - 2017-06

    Rolle: Mitentwicklung an einem Produktempfehlungssystem

    Kunde: BASF, Ludwigshafen


    Aufgaben:

    • Implementierte einen Algorithmus zur Interpretation von Interaktionen in xgboost-Modellen
    • Benchmarking gegen Warenkorbanalyse / Assoziationsregeln


    Kenntnisse:

    R, xgboost


    2015-04 - 2017-06

    Rolle: Effiziente Parameterschätzung in R

    Kunde: IBE, LMU München


    Aufgaben:

    • Entwarf und programmierte einen laufzeiteffizienten EM-Algorithmus zur Schätzung von Risikoparametern bei Krebspatienten.


    Kenntnisse:

    R, R mit C++, Parallel Processing (BatchJobs-Paket), Cluster computing (Sun Grid Engine)


    2015-08 - 2017-01

    Kunde:  Ipsos Loyalty GmbH


    Aufgaben:

    • Automatisierung wiederkehrender Analysen
    • Entwickelte Skripte zur automatisierten Auswertung quartalsweise wiederkehrender Datenauswertungen.


    Kenntnisse:

    Python, SPSS (Makros)


    2016-06 - 2016-07

    Rolle: Price Forward Curve für Strompreise

    Kunde: Bayerngas Energy GmbH, München


    2015-11 - 2016 -01

    Kunde: Sport- und Freizeitparadies GYM 80 GmbH


    Aufgaben:

    • Leitung eines Marktforschungsprojekts
    • Leitung eines Marktforschungsprojekts. Entwurf des Untersuchungsdesigns und anschließende statistische
    • Auswertung und Berichterstellung.


    Kenntnisse:

    R


    2015-10 - 2015 -12

    Kunde: Universitätsklinikum, Tirol


    Aufgaben:

    • Datenanalyse für eine Forschungsarbeit
    • Entwickelte ein statistisches Prognosemodell für einen Biomarker anhand verschiedener klinischer Parameter


    Kenntnisse:

    Gemischtes lineares Modell mit R, dynamische Berichterstellung mit RMarkdown


    2013-10 - 2015 -12

    Kunde: LMU München


    Aufgaben:

    • Parallelisierung eines statistischen Modells, Genzentrum
    • Parallelisierte via MapReduce-Ansatz ein GAMs (Generalisiertes Additives Modell) in R


    Kenntnisse:

    R, Parallel Processing (BatchJobs-Paket)


    2015-08 - 2015 -09

    Kunde: LMU München


    Aufgaben:

    • Statistische Auswertung einer empirischen Studie, Fakultät für Psychologie und Pädagogik
    • Bestimmung relevanter Faktoren auf den Erfolg von frühkindlichen Bildungsprogrammen. In Zusammenarbeit mit der Kindernothilfe


    Kenntnisse:

    SPSS, Gemischtes Lineares Modell


    2013-04 - 2013 -09

    Kunde: IMBE, FAU Erlangen


    Aufgaben:

    • Machine Learning-Vergleichsstudie
    • Planung und Durchführung einer Vergleichsstudie von Machine Learning-Algorithmen zur Klassifikation von Reflektanzspektren
    • Link auf Anfrage

    Kenntnisse:

    R, Cluster Computing (Sun Grid Engine)


    2013-03 - 2013 -09

    Rolle: Wissenschaftliche Hilfskraft

    Kunde: Statistisches Beratungslabor (StaBLab) der LMU, München


    Aufgaben:

    Statistische Beratung von Studierenden und Externen


    2011-05 - 2013-04

    Rolle: Werkstudent

    Kunde: STAT-UP Statistical Consulting & Services, München


    Aufgaben:

    • Programmierung statistischer Lösungen in R und SPSS


    Relevante Projekte:

    • Entwickelte R-Pakete, -Skripte und Dokumentationen im Bereich Lebensmittelsicherheit für das Bundesinstitut für Risikobewertung (BfR)
    • Entwarf eine Datenbank (MySQL) in einem Projekt zur Berechnung von Wachstums- und Inaktivierungsparametern von mikrobiologischen Modelle


    2012-03 - 2012 -05

    Kunde: Münchner Start-Up


    Aufgaben:

    • Entwicklung eines Prognosemodells
    • Prognose der Benutzerzahlen einer Smartphone-App zur Investorengewinnung mit Hilfe der Verbindung von demographischen Daten und statistischen Wachstumsmodellen


    Kenntnisse:

    R

    Programmiersprachen

    Bash
    Seit 2003
    Linux shell
    Python
    Seit 2017
    R
    Seit 2010
    Shiny
    SPSS
    Seit 2015
    SQL

    Datenbanken

    MySQL
    NoSQL

    Berechnung / Simulation / Versuch / Validierung

    Sun Grid Engine
    xgboost

    Branchen

    Branchen

    • Finanzen
    • Energie
    • Marktforschung
    • Bioinformatik
    • klinische Forschung
    • Start-Ups
    • Universitäten

    Einsatzorte

    Einsatzorte

    München (+100km) Nürnberg (+50km) Mindelheim (+100km) Erlangen (+100km) Deggendorf (+75km)
    nicht möglich

    Projekte

    Projekte

    9 Jahre 3 Monate
    2014-12 - heute

    Dozententätigkeit

    Dozent
    Dozent
    • Halten und Weiterentwickeln der Kurse ?Data Science Methodenkurs?
    • ?Praktische Datenanalyse mit R?, und ?Programmieren mit R?
    Essential Data Science GmbH, München
    1 Jahr 8 Monate
    2020-05 - 2021-12

    Management und Entwicklung einer Data Pipeline in Palantir Foundry

    Cloud Data Engineer Python PySpark Palantir Foundry ...
    Cloud Data Engineer
    • Entwicklung einer Datenverarbeitungspipeline die die Wirtschaftlichkeit für Energiekontrakte berechnet
    • Migration eines Datenverarbeitungssystems von Palantir Foundry nach Amazon Web Services
    • Erstellung von Analysen und Reports für Anwender aus dem Handel
    Python PySpark Palantir Foundry AWS (Lambda Glue S3 SageMaker) pySpark SQL Azure DevOps
    EnBW AG, Karlsruhe
    Remote
    1 Jahr 8 Monate
    2018-08 - 2020-03

    End-to-End Deployment

    Full Stack Data Scientist, Energy Analytics Python xgboost Spark ...
    Full Stack Data Scientist, Energy Analytics
    • End-to-End Deployment eines Prognosemodells für Stromgeneration auf Microsoft Azure
    • Entwickelte Python-Paket für Prognosemodelle von Energieverbrauch von Privathaushalten
    • Entwickelte Modelle zur Anomalieerkennung von ungewöhnlichem Stromverbrauch
    Python xgboost Spark Azure Cloud Docker Databricks
    E.ON SE, München
    4 Monate
    2018-04 - 2018-07

    Big Data Engineering

    AWS Spark Hadoop ...
    • Implementierte eine Datenverarbeitungs-Pipeline, von gelieferten Daten in einen internen Hive-Speicher, mit Spark in Python und R
    AWS Spark Hadoop Python Hive Databricks
    aifora GmbH
    Düsseldorf
    4 Monate
    2018-04 - 2018-07

    Predictive Analytics

    Python scikit-learn Jupyter ...

    • Programmierte ein Modell zur automatischen Berechnung von Einstellungen von Fitnessgeräten aufgrund von Körpersegmentlängen

    Python scikit-learn Jupyter Scrum/Agile
    Milon Care GmbH
    11 Monate
    2017-05 - 2018-03

    Automatische Fehlerkorrektur in Zeitreihen

    Data Scientist R RStudio Shiny ...
    Data Scientist
    Drei Folgeaufträge:
    • Erstellte ein Programm zum automatischen Pricing von Kundenanfragen
    • Entwarf und programmierte einen Algorithmus zur Generierung von Price Forward Curves für Strompreise, von Stunden- bis Monatsgranularität
    • Programmierte eine Shiny-Applikation zur explorativen Einstellung von Parametern für einen Handelsalgorithmus
    • Optimierte die Laufzeit eines R-Programms zum realtime-Pricing von Handelsdaten von 120 Sekunden pro Iteration auf 15 Sekunden
    R RStudio Shiny VBA
    Trumpf AG
    Ditzingen (Remote)
    2 Monate
    2018-01 - 2018-02

    Search Engine Optimization

    Amazon Web Services (EC2) R
    • Webseiten-Audit mit sitespeed.io
    • Setup einer AWS-Instanz zum Web-crawling mit Sitebulb
    • Mitarbeit an einem Algorithmus zum automatischen Vorschlagen von Keywords für Webseiten
    Amazon Web Services (EC2) R
    Artios.io
    London (remote)
    6 Monate
    2017-01 - 2017-06

    Mitentwicklung an einem Produktempfehlungssystem

    Data Scientist R xgboost
    Data Scientist
    • Implementierte einen Algorithmus zur Interpretation von Interaktionen in xgboost-Modellen
    • Benchmarking gegen Warenkorbanalyse / Assoziationsregeln
    R xgboost
    BASF SE
    Ludwigshafen
    2 Jahre 3 Monate
    2015-04 - 2017-06

    Effiziente Parameterschätzung in R

    Doktorand Parallel Processing Algorithmenentwicklung Statistik ...
    Doktorand
    • Entwarf und programmierte einen laufzeiteffizienten EM-Algorithmus zur Schätzung von Risikoparametern bei Krebspatienten
    R Sun Grid Engine
    Parallel Processing Algorithmenentwicklung Statistik Cluster Computing
    IBE, LMU
    München
    1 Jahr 6 Monate
    2015-08 - 2017-01

    Automatisierung wiederkehrender Analysen

    Algorithmenentwicklung
    • Entwickelte Skripte zur automatisierten Auswertung quartalsweise wiederkehrender Datenauswertungen
    SPSS Python
    Algorithmenentwicklung
    Ipsos Loyalty GmbH
    München
    2 Monate
    2016-06 - 2016-07

    Price Forward Curve für Strompreise

    Data Scientist R Parallel Processing Performanceoptimierung ...
    Data Scientist


      R Parallel Processing Performanceoptimierung Shiny
      Bayerngas Energy GmbH
      München
      3 Monate
      2015-11 - 2016-01

      Leitung eines Marktforschungsprojekts

      Freiberuflicher Statistiker Statistik Datenanalyse
      Freiberuflicher Statistiker
      • Leitung eines Marktforschungsprojekts
      • Entwurf des Untersuchungsdesigns und anschließende statistische Auswertung und Berichterstellung
      R
      Statistik Datenanalyse
      Sport- und Freizeitparadies GYM 80 GmbH
      3 Monate
      2015-10 - 2015-12

      Datenanalyse für eine Forschungsarbeit

      Freiberuflicher Statistiker RMarkdown Gemischte Lineare Modelle R
      Freiberuflicher Statistiker
      • Entwickelte ein statistisches Prognosemodell für einen Biomarker anhand verschiedener klinischer Parameter
      R
      RMarkdown Gemischte Lineare Modelle R
      Universitätsklinikum, Tirol
      Tirol
      2 Jahre 3 Monate
      2013-10 - 2015-12

      Parallelisierung eines statistischen Modells

      Doktorand Parallel Processing
      Doktorand
      • Parallelisierte via MapReduce-Ansatz ein GAMs (Generalisiertes Additives Modell) in R
      • Reduzierung der Laufzeit statistischer Modelle auf großen Genexpressionsdatensätzen
      R
      Parallel Processing
      Genzentrum, LMU
      München
      2 Monate
      2015-08 - 2015-09

      Statistische Auswertung einer empirischen Studie

      Freiberuflicher Statistiker Datenanalyse
      Freiberuflicher Statistiker
      • Bestimmung relevanter Faktoren auf den Erfolg von frühkindlichen Bildungsprogrammen
      • In Zusammenarbeit mit der Kindernothilfe
      SPSS
      Datenanalyse
      Fakultät für Psychologie und Pädagogik, LMU München
      6 Monate
      2013-04 - 2013-09

      Machine Learning-Vergleichsstudie, Masterarbeit

      Cluster Computing Machine Learning
      • Planung und Durchführung einer Vergleichsstudie von Machine Learning-Algorithmen zur Klassifikation von Reflektanzspektren
      • [URL zur Veröffentlichung auf Anfrage]
      Sun Grid Engine R
      Cluster Computing Machine Learning
      Erlangen
      7 Monate
      2013-03 - 2013-09

      Statistische Beratung von Studierenden und Externen

      Wissenschaftliche Hilfskraft
      Wissenschaftliche Hilfskraft
      Statistisches Beratungslabor
      2 Jahre
      2011-05 - 2013-04

      Programmierung statistischer Lösungen in R und SPSS

      Statistiker Statistik Datenanalyse Algorithmen
      Statistiker

      Programmierung statistischer Lösungen in R und SPSS

      Relevante Projekte:

      • Entwicklung von R-Paketen, -Skripten und Dokumentationen im Bereich Lebensmittelsicherheit für
        das Bundesinstitut für Risikobewertung (BfR)

      • Datenbankentwicklung (MySQL) in einem Projekt zur Berechnung von Wachstums- und Inaktivierungsparametern von mikrobiologischen Modellen
      SPSS R MySQL
      Statistik Datenanalyse Algorithmen
      3 Monate
      2012-03 - 2012-05

      Entwicklung eines Prognosemodells

      R
      • Entwicklung eines Prognosemodells der Benutzerzahlen für eine neue Smartphone-App
      R
      Münchner Start-Up

      Aus- und Weiterbildung

      Aus- und Weiterbildung

      3 Jahre 11 Monate
      2013-10 - 2017-08

      Promotion (Dr. rer. nat)

      Dr.rer.nat, IBE, Ludwig-Maximilians-Universität München
      Dr.rer.nat
      IBE, Ludwig-Maximilians-Universität München

      • Dissertation auf Anfrage

      2 Jahre
      2011-10 - 2013-09

      Master-Studium der Statistik

      Master, Ludwig-Maximilians-Universität, München
      Master
      Ludwig-Maximilians-Universität, München
      • Machine Learning
      3 Jahre
      2008-10 - 2011-09

      Bachelor-Studium der Statistik

      Bachelor, Ludwig-Maximilians-Universität, München
      Bachelor
      Ludwig-Maximilians-Universität, München
      • Nebenfach Informatik
      2 Jahre 11 Monate
      2005-09 - 2008-07

      Ausbildung zum Fachinformatiker

      Fachinformatiker, Bundesamt für Migration und Flüchtlinge, Nürnberg
      Fachinformatiker
      Bundesamt für Migration und Flüchtlinge, Nürnberg
      • Fachrichtung Anwendungsentwicklung

      Position

      Position

      • Data Scientist

      Kompetenzen

      Kompetenzen

      Top-Skills

      Data Science R Python

      Schwerpunkte

      Big Data
      Spark, Databricks, Amazon AWS, Microsoft Azure
      Data Science
      Machine Learning, Deep Learning, maßgeschneiderte Algorithmen
      Deep Learning
      Kommunikation
      Schulungen, anwenderfreundliches Vermitteln von Methoden und Ergebnissen, technisches sowie angewandtes Schreiben
      Machine Learning
      Optimierung
      Laufzeitoptimierung von Programmen und Algorithmen, Automatisierung von komplexen Arbeitsabläufen
      Programmieren
      Python, R, SQL, Linux shell

      Produkte / Standards / Erfahrungen / Methoden

      Algorithmen
      Algorithmenentwicklung
      Apache Spark
      Cloudera
      Cluster Computing
      Sun Grid Engine
      Datenanalyse
      Hadoop
      Cloudera Certified Spark and Hadoop Developer
      Parallel Processing
      in R. Multicore sowie Clusterumgebungen
      Performanceoptimierung
      R
      SPSS
      Statistik
      Promotion in Statistik

      Profil:

      • Ich bin Data Scientist im Bereich Machine Learning, und verbinde ein tiefes mathematisches Verständnis der relevanten Algorithmen mit der Fähigkeit, komplexe Analysen in klarer und umsetzbarer Form zu kommunizieren


      IT-Kenntnisse:

      Machine Learning

      • scikit-learn
      • Keras
      • mlr


      Big Data

      • Spark
      • Databricks


      Cloud Computing

      • Amazon Web Services (AWS)
      • Microsoft Azure


      Sonstiges

      • Git
      • Docker
      • Emacs


      Community & Open-Source:

      ml

      • Machine Learning in R, R-Paket
      • Contributor des R-Pakets mlr. Diverse Erweiterungen und Bugfixes als Pull-Requests auf GitHub


      Deep Learning 

      • Startup Name Generator, auf GitHub
      • Python-Paket zum Generieren von Namensvorschlägen für Unternehmen und Software


      GenoGAM 

      • A GAM based framework for analysis of ChIP-Seq data, Bioconductor-Paket
      • Miterstellung eines R-Pakets zum Berechnen parallelisierter statistischer Modelle auf DNA


      Blogging 

      • Zwei Blogs über Statistik und Machine Learning
      • Link auf Anfrage


      Beruflicher Werdegang:

      2022-11 - 2023-03 

      Rolle: Data Scientist, Shape Risk Management

      Kunde: E.ON SE, Essen


      Aufgaben:

      • Entwicklung browserbasierter interaktiver Risiko-Reports für Shape und Performance einer PFC für Strompreise


      Kenntnisse: 

      Python, streamlit, pandas, Azure DevOps


      2014-12 - heute

      Rolle: Dozent

      Kunde: Essential Data Science GmbH, München


      Aufgaben:

      • Halten und Weiterentwickeln der Kurse ?Data Science Methodenkurs?, ?Praktische Datenanalyse mit R?, und ?Programmieren mit R?


      2020-05 - 2022 -10

      Rolle: Data Engineer, Energy Trading

      Kunde: EnBW AG, Karlsruhe


      Aufgaben:

      • Entwicklung einer Datenverarbeitungspipeline die die Wirtschaftlichkeit für Energiekontrakte berechnet
      • Migration eines Datenverarbeitungssystems von Palantir Foundry nach Amazon Web Services
      • Erstellung von Analysen und Reports für Anwender aus dem Handel


      Kenntnisse:

      Palantir Foundry, AWS (Lambda, Glue, S3, SageMaker), Python, pySpark, SQL, Azure DevOps


      2018-08 - 2020-03

      Rolle: Full Stack Data Scientist, Energy Analytics

      Kunde: E.ON SE, München


      Aufgaben:

      • End-to-End Deployment eines Prognosemodells für Stromgeneration auf Microsoft Azure
      • Entwickelte Python-Paket für Prognosemodelle von Energieverbrauch von Privathaushalten
      • Entwickelte Modelle zur Anomalieerkennung von ungewöhnlichem Stromverbrauch


      Kenntnisse:

      Python, xgboost, Spark, Azure Cloud, Docker, Databricks


      2018-04 - 2018-07

      Rolle: Big Data Engineering

      Kunde: aifora GmbH, Düsseldorf


      Aufgaben:

      • Implementierte eine Datenverarbeitungs-Pipeline, von gelieferten Daten in einen internen Hive-Speicher, mit Spark in Python und R


      Kenntnisse:

      AWS, Spark, Hadoop, Python, Hive, Databricks


      2018-04 - 2018-07

      Kunde:  Milon Care GmbH


      Aufgaben:

      • Predictive Analytics
      • Programmierte ein Modell zur automatischen Berechnung von Einstellungen von Fitnessgeräten aufgrund von Körpersegmentlängen


      Kenntnisse:

      Python, scikit-learn, Jupyter, Scrum/Agile


      2017-05 - 2018-03


      Aufgaben:

      Drei Folgeaufträge:

      • Erstellte ein Programm zum automatischen Pricing von Kundenanfragen
      • Entwarf und programmierte einen Algorithmus zur Generierung von Price Forward Curves für Strompreise, von Stunden- bis Monatsgranularität
      • Programmierte eine Shiny-Applikation zur explorativen Einstellung von Parametern für einen Handelsalgorithmus
      • Optimierte die Laufzeit eines R-Programms zum realtime-Pricing von Handelsdaten von 120 Sekunden pro Iteration auf 15 Sekunden


      Kenntnisse:

      R, RStudio, Shiny, VBA


      2018-01 - 2018-02

      Kunde: Artios.io, London


      Aufgaben:

      • Search Engine Optimization
      • Webseiten-Audit mit sitespeed.io
      • Setup einer AWS-Instanz zum Web-crawling mit Sitebulb
      • Mitarbeit an einem Algorithmus zum automatischen Vorschlagen von Keywords für Webseiten


      Kenntnisse: 

      Amazon Web Services (EC2), R


      2017-05 - 2017-10

      Kunde: Trumpf AG, Ditzingen


      Aufgaben:

      • Automatische Fehlerkorrektur in Zeitreihen
      • Entwickelte einen Algorithmus, der automatisch falsche Werte in Zählerständen erkennt und korrigiert


      Kenntnisse:

      R


      2017-01 - 2017-06

      Rolle: Mitentwicklung an einem Produktempfehlungssystem

      Kunde: BASF, Ludwigshafen


      Aufgaben:

      • Implementierte einen Algorithmus zur Interpretation von Interaktionen in xgboost-Modellen
      • Benchmarking gegen Warenkorbanalyse / Assoziationsregeln


      Kenntnisse:

      R, xgboost


      2015-04 - 2017-06

      Rolle: Effiziente Parameterschätzung in R

      Kunde: IBE, LMU München


      Aufgaben:

      • Entwarf und programmierte einen laufzeiteffizienten EM-Algorithmus zur Schätzung von Risikoparametern bei Krebspatienten.


      Kenntnisse:

      R, R mit C++, Parallel Processing (BatchJobs-Paket), Cluster computing (Sun Grid Engine)


      2015-08 - 2017-01

      Kunde:  Ipsos Loyalty GmbH


      Aufgaben:

      • Automatisierung wiederkehrender Analysen
      • Entwickelte Skripte zur automatisierten Auswertung quartalsweise wiederkehrender Datenauswertungen.


      Kenntnisse:

      Python, SPSS (Makros)


      2016-06 - 2016-07

      Rolle: Price Forward Curve für Strompreise

      Kunde: Bayerngas Energy GmbH, München


      2015-11 - 2016 -01

      Kunde: Sport- und Freizeitparadies GYM 80 GmbH


      Aufgaben:

      • Leitung eines Marktforschungsprojekts
      • Leitung eines Marktforschungsprojekts. Entwurf des Untersuchungsdesigns und anschließende statistische
      • Auswertung und Berichterstellung.


      Kenntnisse:

      R


      2015-10 - 2015 -12

      Kunde: Universitätsklinikum, Tirol


      Aufgaben:

      • Datenanalyse für eine Forschungsarbeit
      • Entwickelte ein statistisches Prognosemodell für einen Biomarker anhand verschiedener klinischer Parameter


      Kenntnisse:

      Gemischtes lineares Modell mit R, dynamische Berichterstellung mit RMarkdown


      2013-10 - 2015 -12

      Kunde: LMU München


      Aufgaben:

      • Parallelisierung eines statistischen Modells, Genzentrum
      • Parallelisierte via MapReduce-Ansatz ein GAMs (Generalisiertes Additives Modell) in R


      Kenntnisse:

      R, Parallel Processing (BatchJobs-Paket)


      2015-08 - 2015 -09

      Kunde: LMU München


      Aufgaben:

      • Statistische Auswertung einer empirischen Studie, Fakultät für Psychologie und Pädagogik
      • Bestimmung relevanter Faktoren auf den Erfolg von frühkindlichen Bildungsprogrammen. In Zusammenarbeit mit der Kindernothilfe


      Kenntnisse:

      SPSS, Gemischtes Lineares Modell


      2013-04 - 2013 -09

      Kunde: IMBE, FAU Erlangen


      Aufgaben:

      • Machine Learning-Vergleichsstudie
      • Planung und Durchführung einer Vergleichsstudie von Machine Learning-Algorithmen zur Klassifikation von Reflektanzspektren
      • Link auf Anfrage

      Kenntnisse:

      R, Cluster Computing (Sun Grid Engine)


      2013-03 - 2013 -09

      Rolle: Wissenschaftliche Hilfskraft

      Kunde: Statistisches Beratungslabor (StaBLab) der LMU, München


      Aufgaben:

      Statistische Beratung von Studierenden und Externen


      2011-05 - 2013-04

      Rolle: Werkstudent

      Kunde: STAT-UP Statistical Consulting & Services, München


      Aufgaben:

      • Programmierung statistischer Lösungen in R und SPSS


      Relevante Projekte:

      • Entwickelte R-Pakete, -Skripte und Dokumentationen im Bereich Lebensmittelsicherheit für das Bundesinstitut für Risikobewertung (BfR)
      • Entwarf eine Datenbank (MySQL) in einem Projekt zur Berechnung von Wachstums- und Inaktivierungsparametern von mikrobiologischen Modelle


      2012-03 - 2012 -05

      Kunde: Münchner Start-Up


      Aufgaben:

      • Entwicklung eines Prognosemodells
      • Prognose der Benutzerzahlen einer Smartphone-App zur Investorengewinnung mit Hilfe der Verbindung von demographischen Daten und statistischen Wachstumsmodellen


      Kenntnisse:

      R

      Programmiersprachen

      Bash
      Seit 2003
      Linux shell
      Python
      Seit 2017
      R
      Seit 2010
      Shiny
      SPSS
      Seit 2015
      SQL

      Datenbanken

      MySQL
      NoSQL

      Berechnung / Simulation / Versuch / Validierung

      Sun Grid Engine
      xgboost

      Branchen

      Branchen

      • Finanzen
      • Energie
      • Marktforschung
      • Bioinformatik
      • klinische Forschung
      • Start-Ups
      • Universitäten

      Vertrauen Sie auf GULP

      Im Bereich Freelancing
      Im Bereich Arbeitnehmerüberlassung / Personalvermittlung

      Fragen?

      Rufen Sie uns an +49 89 500316-300 oder schreiben Sie uns:

      Das GULP Freelancer-Portal

      Direktester geht's nicht! Ganz einfach Freelancer finden und direkt Kontakt aufnehmen.