Data Science, Big Data, Data Warehousing, Datenbankentwicklung & Datenintegration
Aktualisiert am 17.09.2024
Profil
Mitarbeiter eines Dienstleisters
Remote-Arbeit
Verfügbar ab: 01.12.2024
Verfügbar zu: 100%
davon vor Ort: 40%
Skill-Profil eines fest angestellten Mitarbeiters des Dienstleisters

Einsatzorte

Einsatzorte

Deutschland, Schweiz, Österreich
möglich

Projekte

Projekte

8 Jahre 9 Monate
2016-01 - 2024-09

Senior Data Scientist

Teilprojektleitung, Teamleitung, Serviceverantwortung, Lead Developer, Designer, Konzeptersteller Informatica PowerCenter 9.6.1&10.1 Microsoft Azure Microsoft PowerBI Teradata Aster ...
Teilprojektleitung, Teamleitung, Serviceverantwortung, Lead Developer, Designer, Konzeptersteller

  • Erstellen diverser Proof of Concepts mit R und Python
    • Verarbeitung unterschiedlicher Daten  (z.B.: Bilddaten, Daten aus dem Web, SAP Daten
    • Datenanalyse mit R und Python
  • Data Engineering mit Scala und Python
    • Anonymisieren von Daten
    • Data Cleansing
  • Migration von Prozessen auf Hadoop
  • Migration von On-Premise Talent Job zu Python in Databricks für Azure
    • Laden von Daten auf HDFS in einer Microsoft Azure Cloud (Informatica und Talend)
    • Portierung von Informatica Workflows zu Talend
    • Teilprojektleitung von Innovationsprojekten
    • Erstellen von Skripten für den Filetransfer
    • Administration Tableau Server
    • Administration Talend Server
    • Installation Talend
    • Teamleitung
    • Enge Zusammenarbeit mit den Endbenutzern
Informatica PowerCenter 9.6.1&10.1 Microsoft Azure Microsoft PowerBI Teradata Aster R Python Scala Shell Perl Java Talend Studio TAC + TMC, Job Server und Remote Engin
E.ON
Hannover
4 Monate
2019-08 - 2019-11

Data Scientist

Workshopleiter Python Jupyter
Workshopleiter

  • Durchführung einer explorativen Datenanalyse mit Python
  • Erzeugen eines Regressionsmodells zur Preisvorhersage
  • Vergleich verschiedener maschineller Lernalgorithmen
  • Data Cleansing
  • Feature Extraction
  • Vorbeitung/Durchführung eines zwei tägigen Workshops
    • Einführung in Data Science mit Python
    • Jupyter
    • Numpy
    • Pandas
    • scikit-learn
    • matplotlib & seaborn
Python Jupyter
8 Monate
2018-02 - 2018-09

Data Scientist

Teilprojektleitung, Entwickler, Designer, Konzeptersteller Talend 6.5.1 R RStudio
Teilprojektleitung, Entwickler, Designer, Konzeptersteller

Erstellen eines Social Media Proof of Concepts mit R

  • Verarbeitung von Social Media Daten mit R
  • Data Cleansing mit R
  • Data Wrangling  mit R
  • Data Mining mit R
  • Automatisierung der Strecke mit Talend 6.5.1
  • Twitter Anbindung
  • Feature Extraction
  • Data Mining

Talend 6.5.1 R RStudio
4 Jahre 4 Monate
2013-09 - 2017-12

Wartung eines Technischen Data Warehouses

Wartung, Optimierung Oracle Warehouse Builder 11gR2 MicroStrategy
Wartung, Optimierung

Wartung eines Technischen Data Warehouses

  • Überprüfung der Daten in den Zieltabellen und der Ladeprotokolle
  • Anpassung des Ablaufplanes (Crontab) auf geänderte Laufzeiten
  • Anpassung der Ladeläufe bei geänderten Datenlieferungen
  • Kontrolle der MicroStrategy-Dashboards
  • Historisierungs- und Performanceoptimierung

Oracle Warehouse Builder 11gR2 MicroStrategy
1 Jahr
2015-01 - 2015-12

Entwicklung eines Data Warehouses

Entwickler, Designer, Konzeptersteller, Tester Informatica PowerCenter 9.5.1 EXASolution Oracle Database 11
Entwickler, Designer, Konzeptersteller, Tester

 o   Analyse des Quellsystems

o   Modellierung und Optimierung für EXASolution und Oracle

o   Design und Entwicklung verschiedener Mappings

o   Implementierung dreifach versionierter Tabellen

o   Optimierung der Prozesse und Erstellung von Workflows

o   Testen der Entwicklung

o   Enge Zusammenarbeit mit den Endbenutzern

o   Verfassen von Entwicklerdokumentation 

Informatica PowerCenter 9.5.1 EXASolution Oracle Database 11
7 Monate
2014-07 - 2015-01

Streaming von Twitter-Daten

Data Scientist, Entwickler, Designer, Konzeptersteller, Tester Informatica Developer 9.6.1 HiveQL
Data Scientist, Entwickler, Designer, Konzeptersteller, Tester

o   Workshop zur Analyse der Hashtags

o   Streaming der Twitter Daten nach Hashtags mit Informatica 9.6.1

o   Speicherung der Quelldaten in Hadoop Distributed File System (HDFS) mit Informatica 9.6.1

o   Analyse der Quelldaten und Anpassung der Hashtags (Explorative Datenanalyse mit HiveQL)

o   Transformation der Twitter Daten mit Informatica 9.6.1

o   Speicherung der transformierten Daten in einem Data Mart mit Informatica 9.6.1

  • Verfassen von Entwickler- und Anwenderdokumentationen
Informatica Developer 9.6.1 HiveQL
3 Monate
2014-09 - 2014-11

DataStage Migration

Entwickler, Designer, Konzeptersteller, Tester DataStage 7.1 & 8.5
Entwickler, Designer, Konzeptersteller, Tester

 o   Analyse des Quellsystems (DataStage 7.1, Window Server 2003)

o   Planung der Migration auf DataStage 8.5 (Windows Server 2008)

o   Migration und Neuentwicklung von Prozessen

o   Testen der Migration und Optimierung der Prozesse

DataStage 7.1 & 8.5
3 Monate
2014-07 - 2014-09

Entwicklung eines Data Warehouses

Entwickler, Designer, Konzeptersteller, Tester DataStage Netezza
Entwickler, Designer, Konzeptersteller, Tester

o   Analyse des Quellsystems

o   Design und Entwicklung verschiedener Mappings zum Quelle-Ziel Mapping

o   Implementierung der Mappings in der Programmiersprache SQL und mit DataStage unter Windows 7

o   Implementierung der Sequenzen mit DataStage unter Windows 7

o   Implementierung doppelt versionierter Tabellen

o   Optimierung der Prozesse und Erstellung von Sequenzen

o   Testen der Entwicklung

o   Enge Zusammenarbeit mit den Endbenutzern

o   Verfassen von Entwicklerdokumentation 

DataStage Netezza
1 Jahr
2013-07 - 2014-06

Entwicklung eines Technischen Data Warehouses

Entwickler, Designer, Konzeptersteller, Supporter, Tester, stellvertr. Teilprojektleitung Oracle Warehouse Builder 11gR2 Oracle Database 11gR2
Entwickler, Designer, Konzeptersteller, Supporter, Tester, stellvertr. Teilprojektleitung

Entwicklung eines Technischen Data Warehouses

 

o   Analyse des Quellsystems und Erstellung Quelle-Ziel-Mapping

o   Design und Entwicklung verschiedener ETL-Prozesse auf Basis von Quelle-Ziel Mapping

o   Transformation der Daten mit dem Oracle Warehouse Builder:

o   Aggregation (Summieren, Maximale Werte,...)

o   Konvertieren von Datentypen (z.B.: Numeric -> Date)

o   Filtern und Ersetzen fehlerhafter Daten (Data cleansing)

o   Überprüfung von Abhängigkeiten durch Lookups

o   Setzen von Dummies bei fehlerhaften Quelldaten

o   Denormalisierung durch dublettenfreies Laden der Daten aus einer Spalte

o   Individuelle Expressions in SQL

o   Nutzung diverser Ladestrategien für optimales Laden in die Zieltabellen (Set based/row based)

o   Validieren der Mappings und Generieren des PL/SQL Packages

o   Fehleranalyse mit dem Debugger und im generierten PL/SQL Code

o   Automatisiertes Deployment durch Nutzung von OMB+

o   Implementierung einer Automatisierung in der Programmiersprache PL/SQL

o   Enge Zusammenarbeit mit der Kundenseite sowie anderer Entwicklungspartner über mehrere Phasen

o   Testing und Optimierung der Datenintegration

o   Erstellung der Entwicklerdokumentation und Übergabe der Anwendungen in die Produktion.

Oracle Warehouse Builder 11gR2 Oracle Database 11gR2

Aus- und Weiterbildung

Aus- und Weiterbildung

7 Jahre 1 Monat
2006-01 - 2013-01

Studium der Kognitiven Informatik und der Intelligenten Systeme

Master of Science, Universität Bielefeld
Master of Science
Universität Bielefeld

Hochschulzertifikate

  • Zertifikat ?Data Scientist?

Technische Hochschule Brandenburg ? University of Applied Sciences ? Fachbereich Wirtschaft

  • Zertifikat ?Darstellung der Analyseergebnisse (Storytelling)?

Technische Hochschule Brandenburg ? University of Applied Sciences - Fachbereich Wirtschaft

  • Zertifikat ?Quantitative Methoden und Data Mining? 
Technische Hochschule Brandenburg ? University of Applied Sciences ? Fachbereich Wirtschaft
  • Zertifikat ?Date Preperation und Data Wrangling?
Technische Hochschule Brandenburg ? University of Applied Sciences ? Fachbereich Wirtschaft

  • Zertifikat ?Machine Learning mit Python? 
Technische Hochschule Brandenburg ? University of Applied Sciences - Fachbereich Informatik und Medien

Kompetenzen

Kompetenzen

Produkte / Standards / Erfahrungen / Methoden

Azure
Fortgeschritten
Databricks
Fortgeschritten
HDFS
Fortgeschritten
Hive
Fortgeschritten
Informatica Big Data Management 10.1
Fortgeschritten
Talend 6.2.1-7.3.1
Fortgeschritten
IBM InfoSphere Warehouse V10.1
Fortgeschritten
Tableau 9.3
Fortgeschritten
Informatica PowerCenter 9.1-9.6.1
Fortgeschritten
Oracle Warehouse Builder 11gR2
Snowflake
Basics

Betriebssysteme

Ubuntu
Fortgeschritten
Unix/Linux
Fortgeschritten
MacOSX
Fortgeschritten
Windows X
Fortgeschritten

Programmiersprachen

Assembler
Fortgeschritten
C/C++
Fortgeschritten
Haskell
Fortgeschritten
Java
Experte
Perl
Fortgeschritten
PHP
Fortgeschritten
PL/SQL
Experte
Python
Experte
R
Experte
Scala
Fortgeschritten
SQL
Experte

Datenbanken

EXASOL
Fortgeschritten
Hortonworks HDP 2.3
Fortgeschritten
MySQL
Experte
Oracle 11gR2
Fortgeschritten
SQLite
Fortgeschritten
Teradata Aster 6.20
Fortgeschritten

Branchen

Branchen

  • Versorgungsunternehmen
  • Maschinenbau
  • Politik
  • Audio Technik
  • Finanzdienstleistung
  • Telekommunikation

Einsatzorte

Einsatzorte

Deutschland, Schweiz, Österreich
möglich

Projekte

Projekte

8 Jahre 9 Monate
2016-01 - 2024-09

Senior Data Scientist

Teilprojektleitung, Teamleitung, Serviceverantwortung, Lead Developer, Designer, Konzeptersteller Informatica PowerCenter 9.6.1&10.1 Microsoft Azure Microsoft PowerBI Teradata Aster ...
Teilprojektleitung, Teamleitung, Serviceverantwortung, Lead Developer, Designer, Konzeptersteller

  • Erstellen diverser Proof of Concepts mit R und Python
    • Verarbeitung unterschiedlicher Daten  (z.B.: Bilddaten, Daten aus dem Web, SAP Daten
    • Datenanalyse mit R und Python
  • Data Engineering mit Scala und Python
    • Anonymisieren von Daten
    • Data Cleansing
  • Migration von Prozessen auf Hadoop
  • Migration von On-Premise Talent Job zu Python in Databricks für Azure
    • Laden von Daten auf HDFS in einer Microsoft Azure Cloud (Informatica und Talend)
    • Portierung von Informatica Workflows zu Talend
    • Teilprojektleitung von Innovationsprojekten
    • Erstellen von Skripten für den Filetransfer
    • Administration Tableau Server
    • Administration Talend Server
    • Installation Talend
    • Teamleitung
    • Enge Zusammenarbeit mit den Endbenutzern
Informatica PowerCenter 9.6.1&10.1 Microsoft Azure Microsoft PowerBI Teradata Aster R Python Scala Shell Perl Java Talend Studio TAC + TMC, Job Server und Remote Engin
E.ON
Hannover
4 Monate
2019-08 - 2019-11

Data Scientist

Workshopleiter Python Jupyter
Workshopleiter

  • Durchführung einer explorativen Datenanalyse mit Python
  • Erzeugen eines Regressionsmodells zur Preisvorhersage
  • Vergleich verschiedener maschineller Lernalgorithmen
  • Data Cleansing
  • Feature Extraction
  • Vorbeitung/Durchführung eines zwei tägigen Workshops
    • Einführung in Data Science mit Python
    • Jupyter
    • Numpy
    • Pandas
    • scikit-learn
    • matplotlib & seaborn
Python Jupyter
8 Monate
2018-02 - 2018-09

Data Scientist

Teilprojektleitung, Entwickler, Designer, Konzeptersteller Talend 6.5.1 R RStudio
Teilprojektleitung, Entwickler, Designer, Konzeptersteller

Erstellen eines Social Media Proof of Concepts mit R

  • Verarbeitung von Social Media Daten mit R
  • Data Cleansing mit R
  • Data Wrangling  mit R
  • Data Mining mit R
  • Automatisierung der Strecke mit Talend 6.5.1
  • Twitter Anbindung
  • Feature Extraction
  • Data Mining

Talend 6.5.1 R RStudio
4 Jahre 4 Monate
2013-09 - 2017-12

Wartung eines Technischen Data Warehouses

Wartung, Optimierung Oracle Warehouse Builder 11gR2 MicroStrategy
Wartung, Optimierung

Wartung eines Technischen Data Warehouses

  • Überprüfung der Daten in den Zieltabellen und der Ladeprotokolle
  • Anpassung des Ablaufplanes (Crontab) auf geänderte Laufzeiten
  • Anpassung der Ladeläufe bei geänderten Datenlieferungen
  • Kontrolle der MicroStrategy-Dashboards
  • Historisierungs- und Performanceoptimierung

Oracle Warehouse Builder 11gR2 MicroStrategy
1 Jahr
2015-01 - 2015-12

Entwicklung eines Data Warehouses

Entwickler, Designer, Konzeptersteller, Tester Informatica PowerCenter 9.5.1 EXASolution Oracle Database 11
Entwickler, Designer, Konzeptersteller, Tester

 o   Analyse des Quellsystems

o   Modellierung und Optimierung für EXASolution und Oracle

o   Design und Entwicklung verschiedener Mappings

o   Implementierung dreifach versionierter Tabellen

o   Optimierung der Prozesse und Erstellung von Workflows

o   Testen der Entwicklung

o   Enge Zusammenarbeit mit den Endbenutzern

o   Verfassen von Entwicklerdokumentation 

Informatica PowerCenter 9.5.1 EXASolution Oracle Database 11
7 Monate
2014-07 - 2015-01

Streaming von Twitter-Daten

Data Scientist, Entwickler, Designer, Konzeptersteller, Tester Informatica Developer 9.6.1 HiveQL
Data Scientist, Entwickler, Designer, Konzeptersteller, Tester

o   Workshop zur Analyse der Hashtags

o   Streaming der Twitter Daten nach Hashtags mit Informatica 9.6.1

o   Speicherung der Quelldaten in Hadoop Distributed File System (HDFS) mit Informatica 9.6.1

o   Analyse der Quelldaten und Anpassung der Hashtags (Explorative Datenanalyse mit HiveQL)

o   Transformation der Twitter Daten mit Informatica 9.6.1

o   Speicherung der transformierten Daten in einem Data Mart mit Informatica 9.6.1

  • Verfassen von Entwickler- und Anwenderdokumentationen
Informatica Developer 9.6.1 HiveQL
3 Monate
2014-09 - 2014-11

DataStage Migration

Entwickler, Designer, Konzeptersteller, Tester DataStage 7.1 & 8.5
Entwickler, Designer, Konzeptersteller, Tester

 o   Analyse des Quellsystems (DataStage 7.1, Window Server 2003)

o   Planung der Migration auf DataStage 8.5 (Windows Server 2008)

o   Migration und Neuentwicklung von Prozessen

o   Testen der Migration und Optimierung der Prozesse

DataStage 7.1 & 8.5
3 Monate
2014-07 - 2014-09

Entwicklung eines Data Warehouses

Entwickler, Designer, Konzeptersteller, Tester DataStage Netezza
Entwickler, Designer, Konzeptersteller, Tester

o   Analyse des Quellsystems

o   Design und Entwicklung verschiedener Mappings zum Quelle-Ziel Mapping

o   Implementierung der Mappings in der Programmiersprache SQL und mit DataStage unter Windows 7

o   Implementierung der Sequenzen mit DataStage unter Windows 7

o   Implementierung doppelt versionierter Tabellen

o   Optimierung der Prozesse und Erstellung von Sequenzen

o   Testen der Entwicklung

o   Enge Zusammenarbeit mit den Endbenutzern

o   Verfassen von Entwicklerdokumentation 

DataStage Netezza
1 Jahr
2013-07 - 2014-06

Entwicklung eines Technischen Data Warehouses

Entwickler, Designer, Konzeptersteller, Supporter, Tester, stellvertr. Teilprojektleitung Oracle Warehouse Builder 11gR2 Oracle Database 11gR2
Entwickler, Designer, Konzeptersteller, Supporter, Tester, stellvertr. Teilprojektleitung

Entwicklung eines Technischen Data Warehouses

 

o   Analyse des Quellsystems und Erstellung Quelle-Ziel-Mapping

o   Design und Entwicklung verschiedener ETL-Prozesse auf Basis von Quelle-Ziel Mapping

o   Transformation der Daten mit dem Oracle Warehouse Builder:

o   Aggregation (Summieren, Maximale Werte,...)

o   Konvertieren von Datentypen (z.B.: Numeric -> Date)

o   Filtern und Ersetzen fehlerhafter Daten (Data cleansing)

o   Überprüfung von Abhängigkeiten durch Lookups

o   Setzen von Dummies bei fehlerhaften Quelldaten

o   Denormalisierung durch dublettenfreies Laden der Daten aus einer Spalte

o   Individuelle Expressions in SQL

o   Nutzung diverser Ladestrategien für optimales Laden in die Zieltabellen (Set based/row based)

o   Validieren der Mappings und Generieren des PL/SQL Packages

o   Fehleranalyse mit dem Debugger und im generierten PL/SQL Code

o   Automatisiertes Deployment durch Nutzung von OMB+

o   Implementierung einer Automatisierung in der Programmiersprache PL/SQL

o   Enge Zusammenarbeit mit der Kundenseite sowie anderer Entwicklungspartner über mehrere Phasen

o   Testing und Optimierung der Datenintegration

o   Erstellung der Entwicklerdokumentation und Übergabe der Anwendungen in die Produktion.

Oracle Warehouse Builder 11gR2 Oracle Database 11gR2

Aus- und Weiterbildung

Aus- und Weiterbildung

7 Jahre 1 Monat
2006-01 - 2013-01

Studium der Kognitiven Informatik und der Intelligenten Systeme

Master of Science, Universität Bielefeld
Master of Science
Universität Bielefeld

Hochschulzertifikate

  • Zertifikat ?Data Scientist?

Technische Hochschule Brandenburg ? University of Applied Sciences ? Fachbereich Wirtschaft

  • Zertifikat ?Darstellung der Analyseergebnisse (Storytelling)?

Technische Hochschule Brandenburg ? University of Applied Sciences - Fachbereich Wirtschaft

  • Zertifikat ?Quantitative Methoden und Data Mining? 
Technische Hochschule Brandenburg ? University of Applied Sciences ? Fachbereich Wirtschaft
  • Zertifikat ?Date Preperation und Data Wrangling?
Technische Hochschule Brandenburg ? University of Applied Sciences ? Fachbereich Wirtschaft

  • Zertifikat ?Machine Learning mit Python? 
Technische Hochschule Brandenburg ? University of Applied Sciences - Fachbereich Informatik und Medien

Kompetenzen

Kompetenzen

Produkte / Standards / Erfahrungen / Methoden

Azure
Fortgeschritten
Databricks
Fortgeschritten
HDFS
Fortgeschritten
Hive
Fortgeschritten
Informatica Big Data Management 10.1
Fortgeschritten
Talend 6.2.1-7.3.1
Fortgeschritten
IBM InfoSphere Warehouse V10.1
Fortgeschritten
Tableau 9.3
Fortgeschritten
Informatica PowerCenter 9.1-9.6.1
Fortgeschritten
Oracle Warehouse Builder 11gR2
Snowflake
Basics

Betriebssysteme

Ubuntu
Fortgeschritten
Unix/Linux
Fortgeschritten
MacOSX
Fortgeschritten
Windows X
Fortgeschritten

Programmiersprachen

Assembler
Fortgeschritten
C/C++
Fortgeschritten
Haskell
Fortgeschritten
Java
Experte
Perl
Fortgeschritten
PHP
Fortgeschritten
PL/SQL
Experte
Python
Experte
R
Experte
Scala
Fortgeschritten
SQL
Experte

Datenbanken

EXASOL
Fortgeschritten
Hortonworks HDP 2.3
Fortgeschritten
MySQL
Experte
Oracle 11gR2
Fortgeschritten
SQLite
Fortgeschritten
Teradata Aster 6.20
Fortgeschritten

Branchen

Branchen

  • Versorgungsunternehmen
  • Maschinenbau
  • Politik
  • Audio Technik
  • Finanzdienstleistung
  • Telekommunikation

Vertrauen Sie auf Randstad

Im Bereich Freelancing
Im Bereich Arbeitnehmerüberlassung / Personalvermittlung

Fragen?

Rufen Sie uns an +49 89 500316-300 oder schreiben Sie uns:

Das Freelancer-Portal

Direktester geht's nicht! Ganz einfach Freelancer finden und direkt Kontakt aufnehmen.