Data Engineer und Data Scientist
Aktualisiert am 12.04.2024
Profil
Mitarbeiter eines Dienstleisters
Verfügbar ab: 01.06.2024
Verfügbar zu: 100%
davon vor Ort: 100%
Skill-Profil eines fest angestellten Mitarbeiters des Dienstleisters

Einsatzorte

Einsatzorte

Essen (+75km) Ibbenbüren (+75km) Cochem (+75km) Bonn (+75km) Soest (+50km)
nicht möglich

Projekte

Projekte

1 Jahr 1 Monat
2020-09 - 2021-09

Data Scientist, Energienetze,

Data Scientist Python
Data Scientist
  •  Analyse von georeferenzierten, sozioökonomischen und Energienetzdaten mit Python/GeoPandas/Pandas 
  • Simulationen zur zukünftigen Entwicklung im Wärmesektor (Heizungstechnologien, Energieträger, Energiebedarf) 
  • Planungsunterstützung in Bezug auf Elektromobilität 
  • Visualisierung und Erstellung interaktiver Karten mit Python/Folium/Leaflet 
  • Automatisierte Erstellung von Reports
Jupyter AWS/CodeCommit Pandas GeoPandas Folium/Leaflet H3 geovoronoi OSMnx
Python
Bergheim
8 Monate
2020-01 - 2020-08

Data Scientist

Python-Entwickler und Data Scientist R
Python-Entwickler und Data Scientist
  • Verarbeitung und Transformation von Geodaten mit Python/GeoPandas
  • Geocoding, Spatial Joins
  • Durchführung größerer Berechnungen in der AWS-Cloud
  • Weiterentwicklung einer R-Shiny-Anwendung
  • Initialanalysen mit Power BI
Python Pandas GeoPandas Shiny Power BI
R
Köln
1 Jahr 6 Monate
2018-07 - 2019-12

Apache Kafka Entwicklung

Berater und Entwickler Scrum
Berater und Entwickler
  • Mitarbeit in Kafka DevOps-Team
  • Entwicklung einer Web-basierten Self-Service-Plattform zum Management von Kafka Topics und ACLs
    • Backend-Entwicklung der REST-APIs
    • Continuous Integration
  • Beratung und Schulung von Entwicklerteams
    • Use Cases zur Nutzung von Kafka
    • Implementierung, Konfiguration
  • Weiterentwicklung der Kafka-Plattform
    • Zentralisiertes Logging mittels Filebeat, Metricbeat, ELK
    • Entwicklung von Ansible Playbooks für Deployments
Apache Kafka Kafka Streams Java Spring Boot Git Jenkins Linux Ansible Python
Scrum
Amsterdam
7 Monate
2017-12 - 2018-06

Apache Kafka Entwicklung

Berater und Entwickler
Berater und Entwickler
  • Mitarbeit in internationalem Kafka DevOps Team
  • Softwareentwicklung im Kafka-Umfeld
  • REST API zum Topic- und ACL-Management
  • Customized Principal Builder für SSL-Authentifizierung
  • AVRO-Serialisierung
  • Deployment und Management von Kafka-Clustern per Ansible
  • Entwicklung von Ansible Playbooks
Apache Hadoop Hortonworks Administration Linux Hive Pig Kafka Splunk Storm Ansible AVRO
Nürnberg
5 Monate
2017-07 - 2017-11

Big Data & BI Beratung

Big Data Engineer und Data Scientist
Big Data Engineer und Data Scientist
  •  Aufbau eines Hadoop-Clusters 
  • Datenaufbereitung und -analyse mit Apache Hive, Pig und Spark (PySpark) 
  • Streaming und Verarbeitung von Real-Time Daten mittels Apache NiFi, Kafka und Storm
  • Feature Engineering 
  • Modellentwicklung 
  • Clustering 
  • Automatisierte AWS/EC2-Einrichtung und Ausführung von Programmen, Skript gesteuert
Hadoop (Hortonworks) Linux Hive Pig Kafka Spark (PySpark) Storm SQL AWS
Köln
4 Monate
2017-07 - 2017-10

Big Data

Big Data Engineer Python
Big Data Engineer
  • Aufbau eines Hadoop-Clusters
  • Datenaufbereitung und -analyse mit Apache Hive, Pig und Spark (PySpark)
  • Streaming und Verarbeitung von Real-Time Daten mittels
    Apache NiFi, Kafka und Storm
  • Feature Engineering
  • Modellentwicklung
  • Clusterin
  • Automatisierte AWS/EC2-Einrichtung und Ausführung von Programmen, Skript gesteuert
Apache Hadoop Hortonworks Administration Linux Hive Pig Kafka Splunk Storm Spark PySpark AWS
Python
IT-Beratung
Köln
1 Jahr 7 Monate
2016-01 - 2017-07

Applying Community Drift to Time-Aware Recommender Systems

Masterarbeit Recommender Systems Greedy Filtering
Masterarbeit
  • Modellentwicklung

  - Prognose von Bewertungen
    (Matrix Factorization und Item Neighborhood Modelle)

  - Konstruktion von User- und Item-Graphen
    (K-Nearest-Neighbors, verschiedene Ähnlichkeitsmetriken)

  - User und Item Clustering
    (Community Detection Algorithmen DMID und Walktrap)

  - Maschinelles Lernen der Modellparameter
    (Stochastic Gradient Descent)

  • Implementierung als Algorithmen in Java
  • Evaluierung auf einem Compute Cluster der RWTH Aachen
  • Implementierung eines Recommender Systems mit RESTful API
  • Veröffentlichung der Ergebnisse im Rahmen der RecSys
    Konferenz 2017 (Workshop on Temporal Reasoning in
      Recommender Systems)
Java Eclipse Jersey JUnit Swagger Git Ivy Ant MySQL Java Native Access
Recommender Systems Greedy Filtering
RWTH Aachen
Aachen
8 Jahre 6 Monate
2004-09 - 2013-02

Betreuung Netzwerke

Entwickler Netzwerkadministration Cisco Wireless
Entwickler

Wireless LAN

  • Architektur / Design
  • Implementierung und Betrieb der Infrastruktur
  • Zusammenarbeit mit dem Produktmanagement
  • Mitarbeit im globalen Fokus-Team Wireless LAN
  • Administration Linux-basierter Management-Systeme
    z.B. Cisco Wireless Control System

 

Routing und Switching

  • Planung und Implementierung von Netzwerklösungen
  • Betrieb und Troubleshooting der Infrastruktur
  • Rufbereitschaften

 

Projekte

  • Konzernweite, globale Standardisierung des Wireless LAN

     (Client-Zugriff, Infrastruktur, Hardware, Konfigurationen)

  • Konzeption und Implementierung von WLAN-Lösungen für
    Gastzugänge, IP-Telefonie, Produktionsumgebungen
  • Migration der Netzwerk-Infrastruktur bei
    Unternehmensfusionen und -abspaltungen
  • Evaluierung und Konzeption des Einsatzes von Industrial
    Ethernet Technologien zum Monitoring von Pipelines
Cisco
Netzwerkadministration Cisco Wireless
Chemie/Pharma
Leverkusen

Position

Position

Der Kandidat ist Berater für Big Data und Data Science. Er verfügt über besonders tiefe und praktische Erfahrung mit Apache Kafka.

Im Rahmen eines dualen Wirtschaftsinformatik-Studiums hat er sein Diplom (FH) erlangt. Dieses hat er nach einer mehrjährigen Praxisphase um einen Master-Abschluss an der RWTH Aachen in Informatik ergänzt.

 

Er verfügt über Zertifizierungen als ?Hortonworks Certified Associate? und als ?HDP Certified Spark Developer?.

Kompetenzen

Kompetenzen

Produkte / Standards / Erfahrungen / Methoden

Administration Linux
Ambari
Ansible
Ant
Apache Hadoop
Apache Kafka
AVRO
AWS
Azure
Cisco
Cisco Wireless
Eclipse
Folium
Folium/Leaflet
Git
Hive
Hortonworks
Hortonworks Certified Associate
Ivy
Java Native Access
Jenkins
Jersey
JUnit
Jupyter
Kafka
Kafka Streams
Netzwerkadministration
Pig
Power BI
Scikit-Learn
Scrum
Shell-Scripting
Shiny
Spark
HDP Certified Spark Developer
Splunk Storm
Spring Boot
Swagger
Tableau

Betriebssysteme

Linux

Programmiersprachen

GeoPandas
Java
Leaflet
Pandas
PySpark
R

Datenbanken

MySQL

Berechnung / Simulation / Versuch / Validierung

Greedy Filtering
Python
Recommender Systems

Einsatzorte

Einsatzorte

Essen (+75km) Ibbenbüren (+75km) Cochem (+75km) Bonn (+75km) Soest (+50km)
nicht möglich

Projekte

Projekte

1 Jahr 1 Monat
2020-09 - 2021-09

Data Scientist, Energienetze,

Data Scientist Python
Data Scientist
  •  Analyse von georeferenzierten, sozioökonomischen und Energienetzdaten mit Python/GeoPandas/Pandas 
  • Simulationen zur zukünftigen Entwicklung im Wärmesektor (Heizungstechnologien, Energieträger, Energiebedarf) 
  • Planungsunterstützung in Bezug auf Elektromobilität 
  • Visualisierung und Erstellung interaktiver Karten mit Python/Folium/Leaflet 
  • Automatisierte Erstellung von Reports
Jupyter AWS/CodeCommit Pandas GeoPandas Folium/Leaflet H3 geovoronoi OSMnx
Python
Bergheim
8 Monate
2020-01 - 2020-08

Data Scientist

Python-Entwickler und Data Scientist R
Python-Entwickler und Data Scientist
  • Verarbeitung und Transformation von Geodaten mit Python/GeoPandas
  • Geocoding, Spatial Joins
  • Durchführung größerer Berechnungen in der AWS-Cloud
  • Weiterentwicklung einer R-Shiny-Anwendung
  • Initialanalysen mit Power BI
Python Pandas GeoPandas Shiny Power BI
R
Köln
1 Jahr 6 Monate
2018-07 - 2019-12

Apache Kafka Entwicklung

Berater und Entwickler Scrum
Berater und Entwickler
  • Mitarbeit in Kafka DevOps-Team
  • Entwicklung einer Web-basierten Self-Service-Plattform zum Management von Kafka Topics und ACLs
    • Backend-Entwicklung der REST-APIs
    • Continuous Integration
  • Beratung und Schulung von Entwicklerteams
    • Use Cases zur Nutzung von Kafka
    • Implementierung, Konfiguration
  • Weiterentwicklung der Kafka-Plattform
    • Zentralisiertes Logging mittels Filebeat, Metricbeat, ELK
    • Entwicklung von Ansible Playbooks für Deployments
Apache Kafka Kafka Streams Java Spring Boot Git Jenkins Linux Ansible Python
Scrum
Amsterdam
7 Monate
2017-12 - 2018-06

Apache Kafka Entwicklung

Berater und Entwickler
Berater und Entwickler
  • Mitarbeit in internationalem Kafka DevOps Team
  • Softwareentwicklung im Kafka-Umfeld
  • REST API zum Topic- und ACL-Management
  • Customized Principal Builder für SSL-Authentifizierung
  • AVRO-Serialisierung
  • Deployment und Management von Kafka-Clustern per Ansible
  • Entwicklung von Ansible Playbooks
Apache Hadoop Hortonworks Administration Linux Hive Pig Kafka Splunk Storm Ansible AVRO
Nürnberg
5 Monate
2017-07 - 2017-11

Big Data & BI Beratung

Big Data Engineer und Data Scientist
Big Data Engineer und Data Scientist
  •  Aufbau eines Hadoop-Clusters 
  • Datenaufbereitung und -analyse mit Apache Hive, Pig und Spark (PySpark) 
  • Streaming und Verarbeitung von Real-Time Daten mittels Apache NiFi, Kafka und Storm
  • Feature Engineering 
  • Modellentwicklung 
  • Clustering 
  • Automatisierte AWS/EC2-Einrichtung und Ausführung von Programmen, Skript gesteuert
Hadoop (Hortonworks) Linux Hive Pig Kafka Spark (PySpark) Storm SQL AWS
Köln
4 Monate
2017-07 - 2017-10

Big Data

Big Data Engineer Python
Big Data Engineer
  • Aufbau eines Hadoop-Clusters
  • Datenaufbereitung und -analyse mit Apache Hive, Pig und Spark (PySpark)
  • Streaming und Verarbeitung von Real-Time Daten mittels
    Apache NiFi, Kafka und Storm
  • Feature Engineering
  • Modellentwicklung
  • Clusterin
  • Automatisierte AWS/EC2-Einrichtung und Ausführung von Programmen, Skript gesteuert
Apache Hadoop Hortonworks Administration Linux Hive Pig Kafka Splunk Storm Spark PySpark AWS
Python
IT-Beratung
Köln
1 Jahr 7 Monate
2016-01 - 2017-07

Applying Community Drift to Time-Aware Recommender Systems

Masterarbeit Recommender Systems Greedy Filtering
Masterarbeit
  • Modellentwicklung

  - Prognose von Bewertungen
    (Matrix Factorization und Item Neighborhood Modelle)

  - Konstruktion von User- und Item-Graphen
    (K-Nearest-Neighbors, verschiedene Ähnlichkeitsmetriken)

  - User und Item Clustering
    (Community Detection Algorithmen DMID und Walktrap)

  - Maschinelles Lernen der Modellparameter
    (Stochastic Gradient Descent)

  • Implementierung als Algorithmen in Java
  • Evaluierung auf einem Compute Cluster der RWTH Aachen
  • Implementierung eines Recommender Systems mit RESTful API
  • Veröffentlichung der Ergebnisse im Rahmen der RecSys
    Konferenz 2017 (Workshop on Temporal Reasoning in
      Recommender Systems)
Java Eclipse Jersey JUnit Swagger Git Ivy Ant MySQL Java Native Access
Recommender Systems Greedy Filtering
RWTH Aachen
Aachen
8 Jahre 6 Monate
2004-09 - 2013-02

Betreuung Netzwerke

Entwickler Netzwerkadministration Cisco Wireless
Entwickler

Wireless LAN

  • Architektur / Design
  • Implementierung und Betrieb der Infrastruktur
  • Zusammenarbeit mit dem Produktmanagement
  • Mitarbeit im globalen Fokus-Team Wireless LAN
  • Administration Linux-basierter Management-Systeme
    z.B. Cisco Wireless Control System

 

Routing und Switching

  • Planung und Implementierung von Netzwerklösungen
  • Betrieb und Troubleshooting der Infrastruktur
  • Rufbereitschaften

 

Projekte

  • Konzernweite, globale Standardisierung des Wireless LAN

     (Client-Zugriff, Infrastruktur, Hardware, Konfigurationen)

  • Konzeption und Implementierung von WLAN-Lösungen für
    Gastzugänge, IP-Telefonie, Produktionsumgebungen
  • Migration der Netzwerk-Infrastruktur bei
    Unternehmensfusionen und -abspaltungen
  • Evaluierung und Konzeption des Einsatzes von Industrial
    Ethernet Technologien zum Monitoring von Pipelines
Cisco
Netzwerkadministration Cisco Wireless
Chemie/Pharma
Leverkusen

Position

Position

Der Kandidat ist Berater für Big Data und Data Science. Er verfügt über besonders tiefe und praktische Erfahrung mit Apache Kafka.

Im Rahmen eines dualen Wirtschaftsinformatik-Studiums hat er sein Diplom (FH) erlangt. Dieses hat er nach einer mehrjährigen Praxisphase um einen Master-Abschluss an der RWTH Aachen in Informatik ergänzt.

 

Er verfügt über Zertifizierungen als ?Hortonworks Certified Associate? und als ?HDP Certified Spark Developer?.

Kompetenzen

Kompetenzen

Produkte / Standards / Erfahrungen / Methoden

Administration Linux
Ambari
Ansible
Ant
Apache Hadoop
Apache Kafka
AVRO
AWS
Azure
Cisco
Cisco Wireless
Eclipse
Folium
Folium/Leaflet
Git
Hive
Hortonworks
Hortonworks Certified Associate
Ivy
Java Native Access
Jenkins
Jersey
JUnit
Jupyter
Kafka
Kafka Streams
Netzwerkadministration
Pig
Power BI
Scikit-Learn
Scrum
Shell-Scripting
Shiny
Spark
HDP Certified Spark Developer
Splunk Storm
Spring Boot
Swagger
Tableau

Betriebssysteme

Linux

Programmiersprachen

GeoPandas
Java
Leaflet
Pandas
PySpark
R

Datenbanken

MySQL

Berechnung / Simulation / Versuch / Validierung

Greedy Filtering
Python
Recommender Systems

Vertrauen Sie auf GULP

Im Bereich Freelancing
Im Bereich Arbeitnehmerüberlassung / Personalvermittlung

Fragen?

Rufen Sie uns an +49 89 500316-300 oder schreiben Sie uns:

Das GULP Freelancer-Portal

Direktester geht's nicht! Ganz einfach Freelancer finden und direkt Kontakt aufnehmen.