Java Software Entwicklung und Architektur: Big Data, Hadoop, NoSQL, Data engineering, Suchmaschinen, Information retrieval, Machine learning, Linux
Aktualisiert am 29.07.2021
Profil
Freiberufler / Selbstständiger
Verfügbar ab: 01.10.2021
Verfügbar zu: 100%
davon vor Ort: 100%
Data engineering
Microservices
Software engineering
Java
Cloud Computing
Apache Cassandra
Distributed Systems
Apache Spark
Kubernetes
Deutsch
Muttersprache
Englisch
fließend
Französisch
fortgeschrittene Grundkenntnisse
Portugiesisch
Grundkenntnisse
Serbokroatisch
Grundkenntnisse
Spanisch
fließend

Einsatzorte

Einsatzorte

Berlin (+100km) Malchin (+100km)
nicht möglich

Projekte

Projekte

4 Jahre 9 Monate
2019-07 - heute

Skalierbare Plattform

Architect, Software engineer, DevOps Engineer Java 8 Kubernetes Continuous integration ...
Architect, Software engineer, DevOps Engineer
  • Skalierbare Plattform zur Identifizierung von Language Model Content aka GPT2 Fake Content.
  • Konzeption und Implementierung einer skalierbaren Plattform, die GPT2 Content identifiziert. Die Plattform skaliert nativ mit Kuber- netes und wird kosteneffizient on-premises mit ansible/kubespray deployt.
    • Produkt-Frontend (sign in, sign up, accounting, task submis­sion, task results, Spring Boot 2, Spring MVC, Microservice, K8s Deployment + Service + Ingress).
    • API-backend (authentication, authorization, auditing, task submission, task results, Spring Boot 2, Spring Security, Spring Actuator, Spring Data, ..., Microservice, K8s Deploy­ment + Service+ Ingress).
    • Streaming-Pipeline zur Verarbeitung von NLP-Jobs (Spring Boot 2, Microservices, Kubernetes, S3, Kafka, Tensor- Flow+Python, K8s Deployment + Headless service).
    • Vorbereitung/Konfiguration der hosts, K8s deployment auf on-premises Cluster (Kubeadm/Kubespray, Ansible, Bash, Helm, K8s service-accounts/namespaces).
    • Logging mit dem EFK-Stack (ElasticSearch, Fluentd, Kibana), Monitoring und Alerting mit Grafana und Prometheus (Prometheus Operator), Ingress-Stack mit DNS-load-balancing und letsencrypt-Zertifikate (nginx- ingress, cert-manager, external-dns, AWS Route 53 via IAM-User).
    • Dynamic PV Storage, Datenbank und Object Storage (Rook-Ceph, Rook-Minio, Rook-Cassandra), Backup und Restore der Persistent Volumes auf AWS S3 bucket (Velero, Helm).
    • Docker, Maven und Helmchart registry auf dem K8s cluster (Nexus).
    • CI/CD pipeline auf dem K8s cluster und Anbindung der run­ners (Gitlab).
Java 8 Kubernetes Continuous integration Deep Learning Java Spring Boot 2 Docker Kubernetes (kubespray nginx-ingress cert-manager external-dns velero rook- minio/s3/cassandra ansible Helm) Minio/S3 AWS/S3 AWS/Route53 Kafka Zookeeper Grafana Prometheus Git Gitlab IntelliJ Maven Nexus
Berlin
6 Monate
2019-01 - 2019-06

Architektur und Entwicklung

Architect, Lead developer, Software engineer, Data engineer Java 8 Big Data Kubernetes ...
Architect, Lead developer, Software engineer, Data engineer

Architektur und Entwicklung einer Data Management Platform (DMP) zur Verarbeitung von Click-Stream Daten und zur User-Segmentierung.

Aufgaben:

Konzeption und Implementierung einer Lambda-Architektur zur skalierbaren Aufnahme von Click-Stream Daten und Erstellung von Audience-Segmenten auf einem Kubernetes Cluster, mit folgenden Schwerpunkten:

  • Streaming-Pipeline zur Aufnahme, Transformation, Validierung & Filterung und Persistierung von Click-Stream Daten. (Spring Boot 2, Microservices, Kubernetes, S3, Kafka)
  • Spark-basierende Batch-Jobs zur Ermittlung von Cookie-
    Labels und Berechnung der Segmente mit verschiedenen Auspr¨agungen und verschiedenen Wahrscheinlichkeiten (Cassandra, Spark, S3, Kafka).
  • Indizierung der Segmente zur schnellen Berechnung der Kardinalit ¨ at von kombinierten Audience-Segmenten (Spark, ElasticSearch, Spring Boot 2, Cassandra, Kafka).
  • Entwicklung und Anpassung verschiedener Helm-Charts für die SB-Microservices und Tech-Infrastruktur (Helm, Kubernetes, Cassandra, ElasticSearch, Kafka, Zookeeper, Prometheus, Grafana).
Java 8 Big Data Kubernetes Continuous integration Scrum AdTech Java Spark Spring Boot 2 Kubernetes ElasticSearch S3 Kafka Zookeeper Grafana Prometheus Helm Jira Git Gitlab IntelliJ Maven
Sportradar Media Services GmbH / Sportradar GmbH
Wien
8 Monate
2017-11 - 2018-06

Entwicklung einer skalierbaren Pipeline

Data engineer, Software engineer Java 8 Big Data Hadoop ...
Data engineer, Software engineer
  • Entwicklung einer skalierbaren Pipeline zur Aufnahme, Verarbeitung und Auslieferung von Massen-Bilddaten
  • Entwicklung der neuen, zentralen Plattform und Pipelines zur Verarbeitung und Auslieferung von Bildern und Metadaten. Aufgaben waren unter Anderem:
    • Erstellung diverser Spark-Streaming Jobs (Kafka/
      Hbase/SolR/HDFS), z.B. query-basierende (SolR)
      Auslieferung von skalierten und annotierten Bildern,
      Metadaten(re)indizierung, Aufnahme von neuen Metadaten.
    • Erstellung einer skalierbaren, Spring-Boot basierenden
      Server-Applikation zum Prozessieren (Validierung, Normalisierung, Standardisierung, Skalierung), Indizieren (Metadaten) und Persistieren von Bildern.
    • Erstellung einer Spring-Boot basierenden Client-Applikation
      zum Erfassen und U¨ bertragen der Bilder.
    • Anbindung von deep-learning basierenden subflows zur Metadatengenerierung.
    • Anbindung von legacy subflows mit Bildern und Metadaten.
    • Docker-compose basierendes Test- und Produktivenvironment mit diversen images/container (HBase, Kafka, SolR, Zookeeper, Consul, Grafana, Prometheus, Zookeeper).
Java Spark/Spark (Structured) Streaming SolR Spring Boot HBase Kafka Zookeeper Consul Grafana Prometheus Atlassian Tool Suite (Bitbucket Jira)) Git Jenkins IntelliJ Maven
Java 8 Big Data Hadoop Image Processing Continuous integration
Otto GmbH & Co. KG
Hamburg
11 Monate
2016-11 - 2017-09

Entwicklung eines Produktes

Data engineer, Machine learning engineer Java 8 Python Big Data ...
Data engineer, Machine learning engineer

Entwicklung eines Produktes zur Verarbeitung großer Datenmengen im Kontext AdTech/Market Research

  • Verarbeitung von großen Datenmengen im Kontext von AdTech und Market Research (Details unter NDA):
  • Requirements engineering mit Anforderungen von Produktmanagern und Data Scientists, Erarbeitung von verschiedenen Lösungskonzepten und eines Technologiestacks für die technische Realisierung
  • Design, Implementierung, Build, Dokumentation, Test, Deployment, Troubleshooting und Ende-zu-Ende Mo-
    nitoring einer big-data Lösung, die täglich mehrere TBs auf-
    nimmt und verarbeitet (Java Spark, AWS (EMR, EC2, S3, Glacier, DynamoDB, CloudWatch), Atlassian Tool Suite (Stash, Bamboo))
  • Operationalisierung von prototypischen ML Methoden, die durch das GfK Data Science Team entwickelt wurden (R → Java Spark, PySpark, SparkMLlib)
  • Vorantreiben des Feature-Engineering Prozesses in enger Zusammenarbeit mit dem Data-Science Team und Anbindung und Integration neuer Datenquellen (Java Spark, PySpark, S3)
  • Unterstützung bei Daten-Integrationsaufgaben in Abstimmung mit Engineering Teams von Fremdfirmen.
Spark (Java) PySpark MLlib EMR EC2 S3 Glacier DynamoDB CloudWatch Stash Bamboo Jira Git IntelliJ Maven
Java 8 Python Big Data Algorithmen Predictive Analytics AdTech Market Research Continuous integration Kanban
GfK SE
Berlin
2 Jahre 5 Monate
2015-01 - 2017-05

PaaS

Software-, Data- & DevOps engineer / Software Architect Java 8 NLP Machine learning ...
Software-, Data- & DevOps engineer / Software Architect
  • PaaS: Kundenspezifischer vertikaler Webcrawler und Dataminer
  • Entwicklung und Architektur einer PaaS:
    • Kundenspezifischer Webcrawler und Dataminer
    • Vertikale SE
    • Crawling und Indizierung von URLs und Domains
    • Graph-, NLP-, ML- und Regexbasierendes Datamining
    • REST-basierende Webservices.
Spark Yarn Storm Eclipse Git Maven Titan ElasticSearch Ansible Cassandra Kafka Spring Stanford CoreNLP
Java 8 NLP Machine learning Big Data Analytics Clustering Classification Explicit Semantic Analysis Continuous Integration
Unternehmen in Gründung
Freiburg und Berlin
1 Jahr
2015-09 - 2016-08

Entwicklung advertiser campaign setup tool

Data engineer, Software engineer Java 8 Big Data Analytics Algorithmen ...
Data engineer, Software engineer
  • Entwicklung advertiser campaign setup tool mit feingranularer, zielgruppengenauer Werbeausspielung
  • Data analysis und enrichment und von Double Click Campaign Manager (DCM) Daten und proprietären Datenquellen:
    • Erzeugung von diversen custom audiences (Spark / EMR / S3/ Parquet) für Kampagnenausspielung in DoubleClick for Publishers (DFP)
    • Implementierung eines auktionsbasierenden forecast-Mechanismus (probabilistische counter) zur CPM-Maximierung, unter Berücksichtigung von konkurrierenden Kampagnen und überlappenden audience-Segmenten.
    • Implementierung einer Spring-Boot-Applikation zur Kommunikation und Weitergabe von analysis data an das Frontend (docker, REST, Swagger, Spring Boot, stups, aws cloud). Entwicklung von diversen data analysis jobs (produktiv und prototypisch) zur Bestimmung von Kontrollgruppen (und uplifts), similar brands, Visitor-Aggregationen, Cookie-Alignment (Spark/EMR/S3/Parquet).
Spark Hadoop/Yarn HDFS Amazon Elastic MapReduce AWS S3 Docker Stups DCM DFP Jenkins Atlassian JIRA Git Eclipse IntelliJ Maven
Java 8 Big Data Analytics Algorithmen MapReduce Audience targeting Audience matching Clustering Collaborative filtering Probabilistic counter Continuous integration Scrum Kanban
Zalando SE
Berlin
4 Monate
2015-04 - 2015-07

Rollout Hortonworks BD Cluster

Data engineer, DevOps engineer Java 8 Continuous Integration Terminal Server ...
Data engineer, DevOps engineer

Rollout Hortonworks BD Cluster für Data Scientists

  • Testdeployment einer Big data Infrastruktur (Hortonworks, Ambari, Docker, Vagrant, Bash). Finale Planung für die Provisionierung des Clusters (Rechtemanagement, Security (Firewall), Authentifizierung und Autorisierung, Directory Services Anbindung (AD/LDAP/Kerberos), Terminal Server, sichere Einbindung von Softwarekomponenten und Repositories)
  • Training und Beratung der Data scientists zur horizontalen Skalierung von single/shared memory Implementierungen (Spark, Hive, Hadoop/Yarn) und zum Einsatz von Continuos integration (Git, Jenkins).
Docker Vagrant Hortonworks Ambari Spark Git Hadoop/Yarn Hive LDAP Kerberos FreeIPA
Java 8 Continuous Integration Terminal Server Scrum Virtualisierung MapReduce Big Data Analytics
ING-DiBa AG
Frankfurt am Main
11 Monate
2014-02 - 2014-12

Entwicklung

Software engineer, Data engineer, Software Architect Java Shell-Script SQL ...
Software engineer, Data engineer, Software Architect

Entwicklung einer hochskalierbaren semantischen Middleware

  • Entwicklung und Architektur einer big-data Plattform zur dynamischen Vernetzung und Analyse unstrukturierter Daten.
  • Entwicklung der inkrementellen Algorithmik (NLP, hazelcast MR, elasticsearch, Cassandra); Analyse, Transformation und Persistierung der abgeleiteten Daten in eine verteilte Graphdatenbank (Titan, Gremlin, Tinkerpop/Blueprints)
  • Entwicklung von performanten Batch-jobs (Hadoop MR, Faunus, TitanHadoop).
Eclipse Ant Maven Subversion Git Gitorious JUnit EasyMock ActiveMQ Hudson Titan Faunus Cassandra Hadoop MySQL Hibernate OpenNLP
Java Shell-Script SQL Gremlin XML NoSQL SOAP REST Spring (Batch Boot Core) Lucene ElasticSearch Natural Language Processing SCRUM Continuos Integration HDFS MapReduce DAO/ORM
iQser GmbH
Wiesbaden
11 Monate
2013-03 - 2014-01

Architektur und Entwicklung

Software engineer, Data engineer, Software architect Java MapReduce Natural Language Processing ...
Software engineer, Data engineer, Software architect

Architektur und Entwicklung einer spezialisierten und verteilten Suchmaschinenanwendung für SEO-Dienstleistungen

Suchmaschine:

  • Crawling
  • Parsing
  • Indexing mit Hadoop/Map-Reduce-Jobs
  • Storage in HDFS u. HBase (content)
  • Cassandra (links, tld-zonefiles(domains))
  • Index mit ElasticSearch (diverse doctypes, mappings und indexes)

Frontend:

Entwicklung des Frontends mit GWT

Backend:

  • Dienste als GWT RPC Services und Servlets (REST)
  • Datenbankanbindung der Client/User-Daten
  • Security, Login, Textprocessing mit CoreNLP und Weka
  • Mailing

Client-App:

  • Entwicklung einer Desktop-Applikation mit Java FX
  • Browsersteuerung via Selenium
  • Backend-Kommunikation via JSON/servlets
  • Steuerung mehreren Browser- Instanzen
  • Lokale Datenverwaltung mit SQLite
  • Schneller Crawler für client URLs
Hadoop HDFS Hive Mahout Stanford CoreNLP GWT Tomcat MySQL Cassandra (thrift CQL3) HBase Hive Pig JSP Hibernate JavaMail Weka Mahout Lucene NetBeans
Java MapReduce Natural Language Processing Machine Learning SQL & NoSQL XML/XSD Shell-Script Python JavaScript SQL FXML & Kontext UiBinder XML CSS HTML DAO/ORM WebServices MVC
Startup
Freiburg
4 Jahre
2009-01 - 2012-12

Administration Linux-Cluster

Administrator GPGPUNodes Failover-Fileserving UPS
Administrator

Beschaffung, Aufbau und Administrierung eines Linux HPC-Clusters (shared und distributed memory, grid).

Shell-Script Python Grid (Sun Grid Engine) Apache Httpd CMS (Zope/Plone WordPress) FTP DNS (Bind) LDAP Samba NFS Wiki (DokuWiki MoinMoin) Virtualisierung (VirtualBox qemu VMWare)
GPGPUNodes Failover-Fileserving UPS
Universität Freiburg, Lehrstuhl für Simulation
Freiburg
7 Monate
2009-06 - 2009-12

Entwicklung eines Multiphysik- Simulators

Modellierung, Architektur, Entwicklung Agile Softwareentwicklung (SCRUM) Smoothed Particle Hydrodynamics Dissipative Particle Dynamics ...
Modellierung, Architektur, Entwicklung

Entwicklung eines parallelen, partikelbasierenden Multiphysik- Simulators für die numerische Charakterisierung und Analyse schwingender Tropfen

  • Entwicklung eines effizienten, partikelbasierenden Multiphysik-Simulators im DFG-Projekts “Electrowetting-Simulation mit Partikelmethoden”:
    • numerische Simulation von kleinen Tropfen, welche
      mittels elektrischer Felder bewegt werden

Schwerpunkte:

  • diskrete Simulation
  • physikalische Modellbildung
  • numerische Charakterisierung
  • scientific computing

Implementierung:

  • modulare Klassenhierarchien für Kräfte, Integratoren, Paarlistenberechnung und Interaktoren
  • Adaptivität und verschiedene solver für die Lösung von linearen Gleichungssystemen. Optimierter und parallelisierter Code
Java C++ JUnit Ant SVN Netbeans ProGuard (Obfuscation) Trac Linux
Agile Softwareentwicklung (SCRUM) Smoothed Particle Hydrodynamics Dissipative Particle Dynamics Smoothed Dissipative Particle Dynamics Moving Least Squares Lineare Gleichungssysteme Hydrodynamik Elektrostatik Partielle Differentialgleichungen Statistik
Universität Freiburg, Lehrstuhl für Simulation
Freiburg
7 Monate
2009-03 - 2009-09

Entwicklung von Modulen

Entwickler Smoothed Particle Hydrodynamics Finite Element Method Lineare Gleichungssysteme ...
Entwickler

Entwicklung von Modulen für ein partikelbasierendes Simulatoren- Framework

  • Kopplung an Finite-Elemente Löser, effiziente Lösung schwachbesetzter lineare Gleichungssysteme
  • Partikel-Feld-Kopplung für Navier-Stokes-Gleichungen und Elektrostatik
  • Kopplung von mesoskopischer und makroskopischer Skala.
C++ Java JUnit SVN Netbeans Eclipse Emacs Linux
Smoothed Particle Hydrodynamics Finite Element Method Lineare Gleichungssysteme Hydrodynamik Elektrostatik Partielle Differentialgleichungen
Universität Freiburg, Lehrstuhl für Simulation
Freiburg
2 Jahre 9 Monate
2005-10 - 2008-06

Entwicklung eines proprietärer design flows

Entwickler, Architekt
Entwickler, Architekt
  • Entwicklung und Erweiterung eines proprietären semicustom Designflows (Java, Perl, C)
  • Reporting, Versionierung (CVS, SVN) und Issuetracking (bugzilla)
  • Erarbeitung des Flowschnittstellendesigns
  • Multisite Daten-Management und -Releasing
  • Versionskontrolle der Flow-Daten
  • EDA-Tool-Einbindung
  • hierarchische XML-basierende Konfiguration
  • Erstellung von Dokumentation (Manuals, Man-Pages, Javadoc) und Tests (JUnit, Perl)
Java Perl C Python PHP XML/XSD SQL JUnit Bugzilla MySQL Netbeans Eclipse Emacs CVS Linux Swing
Micronas GmbH
Freiburg
5 Monate
2007-11 - 2008-03

Entwicklung eines SystemC Simulators

Entwickler, Architekt
Entwickler, Architekt

Entwicklung eines performanten SystemC-Simulators für den Mikrocontroller m8051ew mit vollständiger Abdeckung des Microcodes/Befehlssatzes

C++ Assembler SystemC Emacs CVS Linux
Micronas GmbH
Freiburg
7 Monate
2006-12 - 2007-06

Migration/Entwicklung Projekte Datenbank

Redesign, Entwicklung
Redesign, Entwicklung
  • Migration/Entwicklung einer Online-Datenbank (PHP ! Java Server Faces, TXT ! MySQL/Oracle) für die Projekteverwaltung
  • Erweiterung einer webbasierten Designflow-Projekte-Datenbank zur übergreifenden Dokumentation von Teilprojekten, Releases/IPs und automatisierter Validierung (Perl/Python-Scripts).
Java Perl Python PHP XML/XSD SQL SQL JavaEE/JEE MVC JSF Linux Tomcat Bugzilla MySQL Oracle Eclipse Emacs CVS
Micronas GmbH
Freiburg
1 Jahr 9 Monate
2004-01 - 2005-09

Entwicklung von Simulatoren-Komponenten

Entwickler, Architekt
Entwickler, Architekt
  • Implementierung von Modellen mit der Finite Elemente und Finite Volumen Methode
  • Implementierung einer mesoskaligen Partikel-Feld Kopplung
C++ FEM FVM Diffpack OpenFOAM Linux
Universität Freiburg
Freiburg
5 Monate
2005-03 - 2005-07

Entwicklung einer Geoinformationssystem- Anwendung

Entwickler
Entwickler

Entwicklung einer GUI, Implementierung verschiedener Klassen für die Berechnung und Darstellung von Geo-Daten

C# esri ArcGIS Windows
IVU Umwelt GmbH
Freiburg
3 Monate
2003-04 - 2003-06

Entwicklung/Migration einer Anwendung für Simulationsdaten

Entwickler
Entwickler
  • Entwicklung und Migration einer Anwendung für Simulationsdaten
  • Import, Verarbeitung und Export von Geometrie und Meßpunkten von ANSYS-Simulationsdaten (Pre/Post-Processing)
C++ Fortran Ansys Linux
Universität Freiburg
Freiburg
3 Monate
2002-07 - 2002-09

Komponenten für Prozess/Leitsteuerungssoftware

Entwickler, IAESTE Praktikant
Entwickler, IAESTE Praktikant
  • Mitarbeit in der Entwicklung von Leit- / Prozeßsteuerungssoftware
C VB Visual Studio Windows
IHM Ltda.
Belo Horizonte
3 Monate
2001-08 - 2001-10

MS Windows unattended setup / rollout für SBTerminals

Entwickler
Entwickler
  • Windows unattended setup für autonome, gesicherte SBSysteme/Terminals für verschiedene Zielapplikationen
  • Entwicklung von DLLs (MFC) und Einbindung mittels proprietärer Makros.
C/C++ Script MFC Makrorecorder Windows
EXET AG
Karlsruhe

Aus- und Weiterbildung

Aus- und Weiterbildung

2005:

Ausbildung: Studium Mikrosystemtechnik 

Abschluss: Dipl.-Ing. Mikrosystemtechnik (Gesamtnote: 1,6)

Diplomarbeit:Gerne auf Anfrage


1998 - 2005:

Institution: Universität Freiburg

Ausbildung: Studium Mikrosystemtechnik

2000 - 2001:

Institution: Universität des Baskenlandes, Fakultät für Informatik, San Sebastian, Spanien

Ausbildung: Erasmus Auslandsstudium

Position

Position

  • Data engineer
  • Söftware engineer
  • Söftware architect
  • Machine learningengineer
  • Lead Develöper
  • Consultant

Kompetenzen

Kompetenzen

Top-Skills

Data engineering Microservices Software engineering Java Cloud Computing Apache Cassandra Distributed Systems Apache Spark Kubernetes

Schwerpunkte

Container Orchestration
Data engineering
Information retrieval
Java
Java Software Entwicklung und Architektur
Big Data, Hadoop, NoSQL, Data engineering
Linux
Linux
Machine learning
NoSQL
Search engines
Software engineering
Suchmaschinen

Produkte / Standards / Erfahrungen / Methoden

Amazon EC2
Ansible
Datastax DSE
Elastic MapReduce (EMR)
ElasticSearch
Git
Hadoop
Hamcrest
HDFS
Hortonworks
Jenkins
JUnit
Kafka
Kanban
Lucene
Maven
Mockito
S3
Scrum
SEO
Viel Erfahrung in Suchmaschinenoptimierung / SEO und Entwicklung entsprechender Client-Tools
Spark
Spark-ML
Spark-Streaming
Spring Boot
Spring Core
Stanford CoreNLP
Storm
Stups
Trident
Yarn
Zookeeper

Software-Entwicklung

  • Produkte: Git, Subversion, CVS, Ant/Ivy, Maven, Jenkins, Hudson, JUnit, Mockito, EasyMock, jMock, Hamcrest, Gitorious, Gitlab
  • Methoden: Test-Driven-Development, Objektorientierte Programmierung (OOP, OOD), Continuous Integration, MVC, UML, DAO/ORM, Design Patterns (Entwurfsmuster), agile Softwareentwicklung (Scrum, Kanban)

Hadoop & Friends

  • Produkte: Spark, Hadoop, Hortonworks, Yarn, HDFS, Zookeeper, Datastax DSE, Pig
  • Methoden: Large scale data processing, MapReduce

Streaming

Produkte: Kafka, Storm / Trident, Spark-Streaming

Frameworks & API

  • Produkte: Spring Core, Spring Boot, Spring Batch, Spring Security, Hibernate, JPA
  • Methoden: Dependency Injection, REST, JWT, JMS Message Queuing

Machine learning

  • Produkte: Spark-ML, Hadoop/Yarn/MapReduce, Mahout, Weka
  • Methoden: Clustering, Classification, Regres­sion; Collaborative filtering, Predictive analytics, Deep Learning

Information retrieval

  • Produkte: ElasticSearch, Lucene, Nutch, Stanford CoreNLP, OpenNLP
  • Methoden: Natural Language Processing (NLP), TFIDF similarity und Varianten, Latent Dirichlet Allocation, Latent Semantic Indexing (LSI/LSA/SVD), Clustering & Dimensionality reduction

Cloud, Containerization, Orchestration

Produkte: Amazon EC2, Elastic MapReduce (EMR), Stups, S3, Amazon Mechanical Turk, Google Cloud Storage

Administration

  • Ansible, Puppet Hardware: Cluster­
  • Computing, GPGPU-Computing, Storage, Virtualisation (Virtu­alBox, VMWare, KVM) Services: Apache Httpd, Tomcat, MySQL, Hadoop, HBase, Zookeeper, elasticsearch, Storm, Cassandra, CMS (Zope/Plone, WordPress), FTP, DNS(Bind), LDAP, Samba, NFS, Wiki (DokuWiki, MoinMoin)

Web-Entwicklung

  • Produkte: Google Web Toolkit, Selenium, HtmlUnit, Java Server Faces, JavaFX
  • Methoden: TCP/IP, Internet, OSI

Computational physics & fluid dynamics

  • Analytics and Physics: Modelling, physics & fluid dynamics multiphysics/multiscale-simulation, fluid dynamics, statistics, electrostatics, heat conduction, stress/strain
  • Algorithms and numerics: Particle methods (smoothed particle hydrodynamics, (smoothed) dissipative particle dynamics, moving least squares), PDGL, continuum methods (finite elements, finite differences, finite volume), spherical harmonic functions, efficiently calculating systems of linear equations, simulated annealing
  • Tools: Mathematica, openFOAM, Diffpack, ANSYS, COMSOL Multiphysics

Profil

  • Gerne auch Projekte mit ingenieurwissenschaftlichem (z.B. Signalverarbeitung, Integraltransformationen) und physikalischem Bezug (computational physics, fluid dynamics, s.o.), sofern eine substantielle Üerschneidungen mit meinem beschriebenen fachlichen Schwerpunkt existiert.
    • markierte Produkte mit aktueller Projekterfahrung
    • Gegenwartiger Tatigkeitsschwerpunkt in ?A?
    • Synonyme/Redundanz zur automatisierten Erkennung durch Freiberufler-Portale

Linux

Ich nutze beinahe ausschließlich Linux seit 2003 (Ubuntu, Debian, Fedora, Redhat, Gentoo), im Zeitraum 2009-2012 als Administrator

SEO

Ich verf ¨uge ¨uber viel Erfahrung in Suchmaschinenoptimierung/ SEO und Entwicklung entsprechender Client-Tools.

Background

Gerne auch Projekte mit ingenieurwissenschaftlichem (z.B. Signalverarbeitung, Integraltransformationen) und physikalischem Bezug (computational physics, fluid dynamics, s.o.), sofern eine substantielle U¨ berschneidungen mit meinem beschriebenen fachlichen Schwerpunkt existiert.

Beruflicher Werdegang

2009 - 2012:

Kunde: Universität Freiburg, Technische Fakultät, Institut für Mikrosystemtechnik, Lehrstuhl für Simulation

Rolle: Doktorand, Wissenschaftlicher Mitarbeiter/Doktorand im Bereich Computational Physics/Fluid Dynamics - Entwicklung von Simulatoren

Praktikum:

2002:

Kunde: IHM Engenharia e Sistemas de Automacao Ltda., Belo Horizonte, Brasilien

Betriebshaftpflicht:

ja

Betriebssysteme

Linux
Ubuntu, Debian, Fedora, Redhat, Gentoo

Programmiersprachen

Assembler
Bash/Shell
C#
C/C++
Gremlin
Java 8
Perl
PHP
Python

Datenbanken

Cassandra
Graph-Datenbanken
HBase
Hive
MySQL
Neo4J
NoSQL
Oracle
PostgreSQL
SQL
Titan

Branchen

Branchen

  • E-Commerce
  • IT-Dienstleistungen
  • Forschung
  • Industrie-Dienstleistungen
  • Medien
  • Umwelt/Gesundheitswesen
  • Konsumgüter/Halbleiter

Einsatzorte

Einsatzorte

Berlin (+100km) Malchin (+100km)
nicht möglich

Projekte

Projekte

4 Jahre 9 Monate
2019-07 - heute

Skalierbare Plattform

Architect, Software engineer, DevOps Engineer Java 8 Kubernetes Continuous integration ...
Architect, Software engineer, DevOps Engineer
  • Skalierbare Plattform zur Identifizierung von Language Model Content aka GPT2 Fake Content.
  • Konzeption und Implementierung einer skalierbaren Plattform, die GPT2 Content identifiziert. Die Plattform skaliert nativ mit Kuber- netes und wird kosteneffizient on-premises mit ansible/kubespray deployt.
    • Produkt-Frontend (sign in, sign up, accounting, task submis­sion, task results, Spring Boot 2, Spring MVC, Microservice, K8s Deployment + Service + Ingress).
    • API-backend (authentication, authorization, auditing, task submission, task results, Spring Boot 2, Spring Security, Spring Actuator, Spring Data, ..., Microservice, K8s Deploy­ment + Service+ Ingress).
    • Streaming-Pipeline zur Verarbeitung von NLP-Jobs (Spring Boot 2, Microservices, Kubernetes, S3, Kafka, Tensor- Flow+Python, K8s Deployment + Headless service).
    • Vorbereitung/Konfiguration der hosts, K8s deployment auf on-premises Cluster (Kubeadm/Kubespray, Ansible, Bash, Helm, K8s service-accounts/namespaces).
    • Logging mit dem EFK-Stack (ElasticSearch, Fluentd, Kibana), Monitoring und Alerting mit Grafana und Prometheus (Prometheus Operator), Ingress-Stack mit DNS-load-balancing und letsencrypt-Zertifikate (nginx- ingress, cert-manager, external-dns, AWS Route 53 via IAM-User).
    • Dynamic PV Storage, Datenbank und Object Storage (Rook-Ceph, Rook-Minio, Rook-Cassandra), Backup und Restore der Persistent Volumes auf AWS S3 bucket (Velero, Helm).
    • Docker, Maven und Helmchart registry auf dem K8s cluster (Nexus).
    • CI/CD pipeline auf dem K8s cluster und Anbindung der run­ners (Gitlab).
Java 8 Kubernetes Continuous integration Deep Learning Java Spring Boot 2 Docker Kubernetes (kubespray nginx-ingress cert-manager external-dns velero rook- minio/s3/cassandra ansible Helm) Minio/S3 AWS/S3 AWS/Route53 Kafka Zookeeper Grafana Prometheus Git Gitlab IntelliJ Maven Nexus
Berlin
6 Monate
2019-01 - 2019-06

Architektur und Entwicklung

Architect, Lead developer, Software engineer, Data engineer Java 8 Big Data Kubernetes ...
Architect, Lead developer, Software engineer, Data engineer

Architektur und Entwicklung einer Data Management Platform (DMP) zur Verarbeitung von Click-Stream Daten und zur User-Segmentierung.

Aufgaben:

Konzeption und Implementierung einer Lambda-Architektur zur skalierbaren Aufnahme von Click-Stream Daten und Erstellung von Audience-Segmenten auf einem Kubernetes Cluster, mit folgenden Schwerpunkten:

  • Streaming-Pipeline zur Aufnahme, Transformation, Validierung & Filterung und Persistierung von Click-Stream Daten. (Spring Boot 2, Microservices, Kubernetes, S3, Kafka)
  • Spark-basierende Batch-Jobs zur Ermittlung von Cookie-
    Labels und Berechnung der Segmente mit verschiedenen Auspr¨agungen und verschiedenen Wahrscheinlichkeiten (Cassandra, Spark, S3, Kafka).
  • Indizierung der Segmente zur schnellen Berechnung der Kardinalit ¨ at von kombinierten Audience-Segmenten (Spark, ElasticSearch, Spring Boot 2, Cassandra, Kafka).
  • Entwicklung und Anpassung verschiedener Helm-Charts für die SB-Microservices und Tech-Infrastruktur (Helm, Kubernetes, Cassandra, ElasticSearch, Kafka, Zookeeper, Prometheus, Grafana).
Java 8 Big Data Kubernetes Continuous integration Scrum AdTech Java Spark Spring Boot 2 Kubernetes ElasticSearch S3 Kafka Zookeeper Grafana Prometheus Helm Jira Git Gitlab IntelliJ Maven
Sportradar Media Services GmbH / Sportradar GmbH
Wien
8 Monate
2017-11 - 2018-06

Entwicklung einer skalierbaren Pipeline

Data engineer, Software engineer Java 8 Big Data Hadoop ...
Data engineer, Software engineer
  • Entwicklung einer skalierbaren Pipeline zur Aufnahme, Verarbeitung und Auslieferung von Massen-Bilddaten
  • Entwicklung der neuen, zentralen Plattform und Pipelines zur Verarbeitung und Auslieferung von Bildern und Metadaten. Aufgaben waren unter Anderem:
    • Erstellung diverser Spark-Streaming Jobs (Kafka/
      Hbase/SolR/HDFS), z.B. query-basierende (SolR)
      Auslieferung von skalierten und annotierten Bildern,
      Metadaten(re)indizierung, Aufnahme von neuen Metadaten.
    • Erstellung einer skalierbaren, Spring-Boot basierenden
      Server-Applikation zum Prozessieren (Validierung, Normalisierung, Standardisierung, Skalierung), Indizieren (Metadaten) und Persistieren von Bildern.
    • Erstellung einer Spring-Boot basierenden Client-Applikation
      zum Erfassen und U¨ bertragen der Bilder.
    • Anbindung von deep-learning basierenden subflows zur Metadatengenerierung.
    • Anbindung von legacy subflows mit Bildern und Metadaten.
    • Docker-compose basierendes Test- und Produktivenvironment mit diversen images/container (HBase, Kafka, SolR, Zookeeper, Consul, Grafana, Prometheus, Zookeeper).
Java Spark/Spark (Structured) Streaming SolR Spring Boot HBase Kafka Zookeeper Consul Grafana Prometheus Atlassian Tool Suite (Bitbucket Jira)) Git Jenkins IntelliJ Maven
Java 8 Big Data Hadoop Image Processing Continuous integration
Otto GmbH & Co. KG
Hamburg
11 Monate
2016-11 - 2017-09

Entwicklung eines Produktes

Data engineer, Machine learning engineer Java 8 Python Big Data ...
Data engineer, Machine learning engineer

Entwicklung eines Produktes zur Verarbeitung großer Datenmengen im Kontext AdTech/Market Research

  • Verarbeitung von großen Datenmengen im Kontext von AdTech und Market Research (Details unter NDA):
  • Requirements engineering mit Anforderungen von Produktmanagern und Data Scientists, Erarbeitung von verschiedenen Lösungskonzepten und eines Technologiestacks für die technische Realisierung
  • Design, Implementierung, Build, Dokumentation, Test, Deployment, Troubleshooting und Ende-zu-Ende Mo-
    nitoring einer big-data Lösung, die täglich mehrere TBs auf-
    nimmt und verarbeitet (Java Spark, AWS (EMR, EC2, S3, Glacier, DynamoDB, CloudWatch), Atlassian Tool Suite (Stash, Bamboo))
  • Operationalisierung von prototypischen ML Methoden, die durch das GfK Data Science Team entwickelt wurden (R → Java Spark, PySpark, SparkMLlib)
  • Vorantreiben des Feature-Engineering Prozesses in enger Zusammenarbeit mit dem Data-Science Team und Anbindung und Integration neuer Datenquellen (Java Spark, PySpark, S3)
  • Unterstützung bei Daten-Integrationsaufgaben in Abstimmung mit Engineering Teams von Fremdfirmen.
Spark (Java) PySpark MLlib EMR EC2 S3 Glacier DynamoDB CloudWatch Stash Bamboo Jira Git IntelliJ Maven
Java 8 Python Big Data Algorithmen Predictive Analytics AdTech Market Research Continuous integration Kanban
GfK SE
Berlin
2 Jahre 5 Monate
2015-01 - 2017-05

PaaS

Software-, Data- & DevOps engineer / Software Architect Java 8 NLP Machine learning ...
Software-, Data- & DevOps engineer / Software Architect
  • PaaS: Kundenspezifischer vertikaler Webcrawler und Dataminer
  • Entwicklung und Architektur einer PaaS:
    • Kundenspezifischer Webcrawler und Dataminer
    • Vertikale SE
    • Crawling und Indizierung von URLs und Domains
    • Graph-, NLP-, ML- und Regexbasierendes Datamining
    • REST-basierende Webservices.
Spark Yarn Storm Eclipse Git Maven Titan ElasticSearch Ansible Cassandra Kafka Spring Stanford CoreNLP
Java 8 NLP Machine learning Big Data Analytics Clustering Classification Explicit Semantic Analysis Continuous Integration
Unternehmen in Gründung
Freiburg und Berlin
1 Jahr
2015-09 - 2016-08

Entwicklung advertiser campaign setup tool

Data engineer, Software engineer Java 8 Big Data Analytics Algorithmen ...
Data engineer, Software engineer
  • Entwicklung advertiser campaign setup tool mit feingranularer, zielgruppengenauer Werbeausspielung
  • Data analysis und enrichment und von Double Click Campaign Manager (DCM) Daten und proprietären Datenquellen:
    • Erzeugung von diversen custom audiences (Spark / EMR / S3/ Parquet) für Kampagnenausspielung in DoubleClick for Publishers (DFP)
    • Implementierung eines auktionsbasierenden forecast-Mechanismus (probabilistische counter) zur CPM-Maximierung, unter Berücksichtigung von konkurrierenden Kampagnen und überlappenden audience-Segmenten.
    • Implementierung einer Spring-Boot-Applikation zur Kommunikation und Weitergabe von analysis data an das Frontend (docker, REST, Swagger, Spring Boot, stups, aws cloud). Entwicklung von diversen data analysis jobs (produktiv und prototypisch) zur Bestimmung von Kontrollgruppen (und uplifts), similar brands, Visitor-Aggregationen, Cookie-Alignment (Spark/EMR/S3/Parquet).
Spark Hadoop/Yarn HDFS Amazon Elastic MapReduce AWS S3 Docker Stups DCM DFP Jenkins Atlassian JIRA Git Eclipse IntelliJ Maven
Java 8 Big Data Analytics Algorithmen MapReduce Audience targeting Audience matching Clustering Collaborative filtering Probabilistic counter Continuous integration Scrum Kanban
Zalando SE
Berlin
4 Monate
2015-04 - 2015-07

Rollout Hortonworks BD Cluster

Data engineer, DevOps engineer Java 8 Continuous Integration Terminal Server ...
Data engineer, DevOps engineer

Rollout Hortonworks BD Cluster für Data Scientists

  • Testdeployment einer Big data Infrastruktur (Hortonworks, Ambari, Docker, Vagrant, Bash). Finale Planung für die Provisionierung des Clusters (Rechtemanagement, Security (Firewall), Authentifizierung und Autorisierung, Directory Services Anbindung (AD/LDAP/Kerberos), Terminal Server, sichere Einbindung von Softwarekomponenten und Repositories)
  • Training und Beratung der Data scientists zur horizontalen Skalierung von single/shared memory Implementierungen (Spark, Hive, Hadoop/Yarn) und zum Einsatz von Continuos integration (Git, Jenkins).
Docker Vagrant Hortonworks Ambari Spark Git Hadoop/Yarn Hive LDAP Kerberos FreeIPA
Java 8 Continuous Integration Terminal Server Scrum Virtualisierung MapReduce Big Data Analytics
ING-DiBa AG
Frankfurt am Main
11 Monate
2014-02 - 2014-12

Entwicklung

Software engineer, Data engineer, Software Architect Java Shell-Script SQL ...
Software engineer, Data engineer, Software Architect

Entwicklung einer hochskalierbaren semantischen Middleware

  • Entwicklung und Architektur einer big-data Plattform zur dynamischen Vernetzung und Analyse unstrukturierter Daten.
  • Entwicklung der inkrementellen Algorithmik (NLP, hazelcast MR, elasticsearch, Cassandra); Analyse, Transformation und Persistierung der abgeleiteten Daten in eine verteilte Graphdatenbank (Titan, Gremlin, Tinkerpop/Blueprints)
  • Entwicklung von performanten Batch-jobs (Hadoop MR, Faunus, TitanHadoop).
Eclipse Ant Maven Subversion Git Gitorious JUnit EasyMock ActiveMQ Hudson Titan Faunus Cassandra Hadoop MySQL Hibernate OpenNLP
Java Shell-Script SQL Gremlin XML NoSQL SOAP REST Spring (Batch Boot Core) Lucene ElasticSearch Natural Language Processing SCRUM Continuos Integration HDFS MapReduce DAO/ORM
iQser GmbH
Wiesbaden
11 Monate
2013-03 - 2014-01

Architektur und Entwicklung

Software engineer, Data engineer, Software architect Java MapReduce Natural Language Processing ...
Software engineer, Data engineer, Software architect

Architektur und Entwicklung einer spezialisierten und verteilten Suchmaschinenanwendung für SEO-Dienstleistungen

Suchmaschine:

  • Crawling
  • Parsing
  • Indexing mit Hadoop/Map-Reduce-Jobs
  • Storage in HDFS u. HBase (content)
  • Cassandra (links, tld-zonefiles(domains))
  • Index mit ElasticSearch (diverse doctypes, mappings und indexes)

Frontend:

Entwicklung des Frontends mit GWT

Backend:

  • Dienste als GWT RPC Services und Servlets (REST)
  • Datenbankanbindung der Client/User-Daten
  • Security, Login, Textprocessing mit CoreNLP und Weka
  • Mailing

Client-App:

  • Entwicklung einer Desktop-Applikation mit Java FX
  • Browsersteuerung via Selenium
  • Backend-Kommunikation via JSON/servlets
  • Steuerung mehreren Browser- Instanzen
  • Lokale Datenverwaltung mit SQLite
  • Schneller Crawler für client URLs
Hadoop HDFS Hive Mahout Stanford CoreNLP GWT Tomcat MySQL Cassandra (thrift CQL3) HBase Hive Pig JSP Hibernate JavaMail Weka Mahout Lucene NetBeans
Java MapReduce Natural Language Processing Machine Learning SQL & NoSQL XML/XSD Shell-Script Python JavaScript SQL FXML & Kontext UiBinder XML CSS HTML DAO/ORM WebServices MVC
Startup
Freiburg
4 Jahre
2009-01 - 2012-12

Administration Linux-Cluster

Administrator GPGPUNodes Failover-Fileserving UPS
Administrator

Beschaffung, Aufbau und Administrierung eines Linux HPC-Clusters (shared und distributed memory, grid).

Shell-Script Python Grid (Sun Grid Engine) Apache Httpd CMS (Zope/Plone WordPress) FTP DNS (Bind) LDAP Samba NFS Wiki (DokuWiki MoinMoin) Virtualisierung (VirtualBox qemu VMWare)
GPGPUNodes Failover-Fileserving UPS
Universität Freiburg, Lehrstuhl für Simulation
Freiburg
7 Monate
2009-06 - 2009-12

Entwicklung eines Multiphysik- Simulators

Modellierung, Architektur, Entwicklung Agile Softwareentwicklung (SCRUM) Smoothed Particle Hydrodynamics Dissipative Particle Dynamics ...
Modellierung, Architektur, Entwicklung

Entwicklung eines parallelen, partikelbasierenden Multiphysik- Simulators für die numerische Charakterisierung und Analyse schwingender Tropfen

  • Entwicklung eines effizienten, partikelbasierenden Multiphysik-Simulators im DFG-Projekts “Electrowetting-Simulation mit Partikelmethoden”:
    • numerische Simulation von kleinen Tropfen, welche
      mittels elektrischer Felder bewegt werden

Schwerpunkte:

  • diskrete Simulation
  • physikalische Modellbildung
  • numerische Charakterisierung
  • scientific computing

Implementierung:

  • modulare Klassenhierarchien für Kräfte, Integratoren, Paarlistenberechnung und Interaktoren
  • Adaptivität und verschiedene solver für die Lösung von linearen Gleichungssystemen. Optimierter und parallelisierter Code
Java C++ JUnit Ant SVN Netbeans ProGuard (Obfuscation) Trac Linux
Agile Softwareentwicklung (SCRUM) Smoothed Particle Hydrodynamics Dissipative Particle Dynamics Smoothed Dissipative Particle Dynamics Moving Least Squares Lineare Gleichungssysteme Hydrodynamik Elektrostatik Partielle Differentialgleichungen Statistik
Universität Freiburg, Lehrstuhl für Simulation
Freiburg
7 Monate
2009-03 - 2009-09

Entwicklung von Modulen

Entwickler Smoothed Particle Hydrodynamics Finite Element Method Lineare Gleichungssysteme ...
Entwickler

Entwicklung von Modulen für ein partikelbasierendes Simulatoren- Framework

  • Kopplung an Finite-Elemente Löser, effiziente Lösung schwachbesetzter lineare Gleichungssysteme
  • Partikel-Feld-Kopplung für Navier-Stokes-Gleichungen und Elektrostatik
  • Kopplung von mesoskopischer und makroskopischer Skala.
C++ Java JUnit SVN Netbeans Eclipse Emacs Linux
Smoothed Particle Hydrodynamics Finite Element Method Lineare Gleichungssysteme Hydrodynamik Elektrostatik Partielle Differentialgleichungen
Universität Freiburg, Lehrstuhl für Simulation
Freiburg
2 Jahre 9 Monate
2005-10 - 2008-06

Entwicklung eines proprietärer design flows

Entwickler, Architekt
Entwickler, Architekt
  • Entwicklung und Erweiterung eines proprietären semicustom Designflows (Java, Perl, C)
  • Reporting, Versionierung (CVS, SVN) und Issuetracking (bugzilla)
  • Erarbeitung des Flowschnittstellendesigns
  • Multisite Daten-Management und -Releasing
  • Versionskontrolle der Flow-Daten
  • EDA-Tool-Einbindung
  • hierarchische XML-basierende Konfiguration
  • Erstellung von Dokumentation (Manuals, Man-Pages, Javadoc) und Tests (JUnit, Perl)
Java Perl C Python PHP XML/XSD SQL JUnit Bugzilla MySQL Netbeans Eclipse Emacs CVS Linux Swing
Micronas GmbH
Freiburg
5 Monate
2007-11 - 2008-03

Entwicklung eines SystemC Simulators

Entwickler, Architekt
Entwickler, Architekt

Entwicklung eines performanten SystemC-Simulators für den Mikrocontroller m8051ew mit vollständiger Abdeckung des Microcodes/Befehlssatzes

C++ Assembler SystemC Emacs CVS Linux
Micronas GmbH
Freiburg
7 Monate
2006-12 - 2007-06

Migration/Entwicklung Projekte Datenbank

Redesign, Entwicklung
Redesign, Entwicklung
  • Migration/Entwicklung einer Online-Datenbank (PHP ! Java Server Faces, TXT ! MySQL/Oracle) für die Projekteverwaltung
  • Erweiterung einer webbasierten Designflow-Projekte-Datenbank zur übergreifenden Dokumentation von Teilprojekten, Releases/IPs und automatisierter Validierung (Perl/Python-Scripts).
Java Perl Python PHP XML/XSD SQL SQL JavaEE/JEE MVC JSF Linux Tomcat Bugzilla MySQL Oracle Eclipse Emacs CVS
Micronas GmbH
Freiburg
1 Jahr 9 Monate
2004-01 - 2005-09

Entwicklung von Simulatoren-Komponenten

Entwickler, Architekt
Entwickler, Architekt
  • Implementierung von Modellen mit der Finite Elemente und Finite Volumen Methode
  • Implementierung einer mesoskaligen Partikel-Feld Kopplung
C++ FEM FVM Diffpack OpenFOAM Linux
Universität Freiburg
Freiburg
5 Monate
2005-03 - 2005-07

Entwicklung einer Geoinformationssystem- Anwendung

Entwickler
Entwickler

Entwicklung einer GUI, Implementierung verschiedener Klassen für die Berechnung und Darstellung von Geo-Daten

C# esri ArcGIS Windows
IVU Umwelt GmbH
Freiburg
3 Monate
2003-04 - 2003-06

Entwicklung/Migration einer Anwendung für Simulationsdaten

Entwickler
Entwickler
  • Entwicklung und Migration einer Anwendung für Simulationsdaten
  • Import, Verarbeitung und Export von Geometrie und Meßpunkten von ANSYS-Simulationsdaten (Pre/Post-Processing)
C++ Fortran Ansys Linux
Universität Freiburg
Freiburg
3 Monate
2002-07 - 2002-09

Komponenten für Prozess/Leitsteuerungssoftware

Entwickler, IAESTE Praktikant
Entwickler, IAESTE Praktikant
  • Mitarbeit in der Entwicklung von Leit- / Prozeßsteuerungssoftware
C VB Visual Studio Windows
IHM Ltda.
Belo Horizonte
3 Monate
2001-08 - 2001-10

MS Windows unattended setup / rollout für SBTerminals

Entwickler
Entwickler
  • Windows unattended setup für autonome, gesicherte SBSysteme/Terminals für verschiedene Zielapplikationen
  • Entwicklung von DLLs (MFC) und Einbindung mittels proprietärer Makros.
C/C++ Script MFC Makrorecorder Windows
EXET AG
Karlsruhe

Aus- und Weiterbildung

Aus- und Weiterbildung

2005:

Ausbildung: Studium Mikrosystemtechnik 

Abschluss: Dipl.-Ing. Mikrosystemtechnik (Gesamtnote: 1,6)

Diplomarbeit:Gerne auf Anfrage


1998 - 2005:

Institution: Universität Freiburg

Ausbildung: Studium Mikrosystemtechnik

2000 - 2001:

Institution: Universität des Baskenlandes, Fakultät für Informatik, San Sebastian, Spanien

Ausbildung: Erasmus Auslandsstudium

Position

Position

  • Data engineer
  • Söftware engineer
  • Söftware architect
  • Machine learningengineer
  • Lead Develöper
  • Consultant

Kompetenzen

Kompetenzen

Top-Skills

Data engineering Microservices Software engineering Java Cloud Computing Apache Cassandra Distributed Systems Apache Spark Kubernetes

Schwerpunkte

Container Orchestration
Data engineering
Information retrieval
Java
Java Software Entwicklung und Architektur
Big Data, Hadoop, NoSQL, Data engineering
Linux
Linux
Machine learning
NoSQL
Search engines
Software engineering
Suchmaschinen

Produkte / Standards / Erfahrungen / Methoden

Amazon EC2
Ansible
Datastax DSE
Elastic MapReduce (EMR)
ElasticSearch
Git
Hadoop
Hamcrest
HDFS
Hortonworks
Jenkins
JUnit
Kafka
Kanban
Lucene
Maven
Mockito
S3
Scrum
SEO
Viel Erfahrung in Suchmaschinenoptimierung / SEO und Entwicklung entsprechender Client-Tools
Spark
Spark-ML
Spark-Streaming
Spring Boot
Spring Core
Stanford CoreNLP
Storm
Stups
Trident
Yarn
Zookeeper

Software-Entwicklung

  • Produkte: Git, Subversion, CVS, Ant/Ivy, Maven, Jenkins, Hudson, JUnit, Mockito, EasyMock, jMock, Hamcrest, Gitorious, Gitlab
  • Methoden: Test-Driven-Development, Objektorientierte Programmierung (OOP, OOD), Continuous Integration, MVC, UML, DAO/ORM, Design Patterns (Entwurfsmuster), agile Softwareentwicklung (Scrum, Kanban)

Hadoop & Friends

  • Produkte: Spark, Hadoop, Hortonworks, Yarn, HDFS, Zookeeper, Datastax DSE, Pig
  • Methoden: Large scale data processing, MapReduce

Streaming

Produkte: Kafka, Storm / Trident, Spark-Streaming

Frameworks & API

  • Produkte: Spring Core, Spring Boot, Spring Batch, Spring Security, Hibernate, JPA
  • Methoden: Dependency Injection, REST, JWT, JMS Message Queuing

Machine learning

  • Produkte: Spark-ML, Hadoop/Yarn/MapReduce, Mahout, Weka
  • Methoden: Clustering, Classification, Regres­sion; Collaborative filtering, Predictive analytics, Deep Learning

Information retrieval

  • Produkte: ElasticSearch, Lucene, Nutch, Stanford CoreNLP, OpenNLP
  • Methoden: Natural Language Processing (NLP), TFIDF similarity und Varianten, Latent Dirichlet Allocation, Latent Semantic Indexing (LSI/LSA/SVD), Clustering & Dimensionality reduction

Cloud, Containerization, Orchestration

Produkte: Amazon EC2, Elastic MapReduce (EMR), Stups, S3, Amazon Mechanical Turk, Google Cloud Storage

Administration

  • Ansible, Puppet Hardware: Cluster­
  • Computing, GPGPU-Computing, Storage, Virtualisation (Virtu­alBox, VMWare, KVM) Services: Apache Httpd, Tomcat, MySQL, Hadoop, HBase, Zookeeper, elasticsearch, Storm, Cassandra, CMS (Zope/Plone, WordPress), FTP, DNS(Bind), LDAP, Samba, NFS, Wiki (DokuWiki, MoinMoin)

Web-Entwicklung

  • Produkte: Google Web Toolkit, Selenium, HtmlUnit, Java Server Faces, JavaFX
  • Methoden: TCP/IP, Internet, OSI

Computational physics & fluid dynamics

  • Analytics and Physics: Modelling, physics & fluid dynamics multiphysics/multiscale-simulation, fluid dynamics, statistics, electrostatics, heat conduction, stress/strain
  • Algorithms and numerics: Particle methods (smoothed particle hydrodynamics, (smoothed) dissipative particle dynamics, moving least squares), PDGL, continuum methods (finite elements, finite differences, finite volume), spherical harmonic functions, efficiently calculating systems of linear equations, simulated annealing
  • Tools: Mathematica, openFOAM, Diffpack, ANSYS, COMSOL Multiphysics

Profil

  • Gerne auch Projekte mit ingenieurwissenschaftlichem (z.B. Signalverarbeitung, Integraltransformationen) und physikalischem Bezug (computational physics, fluid dynamics, s.o.), sofern eine substantielle Üerschneidungen mit meinem beschriebenen fachlichen Schwerpunkt existiert.
    • markierte Produkte mit aktueller Projekterfahrung
    • Gegenwartiger Tatigkeitsschwerpunkt in ?A?
    • Synonyme/Redundanz zur automatisierten Erkennung durch Freiberufler-Portale

Linux

Ich nutze beinahe ausschließlich Linux seit 2003 (Ubuntu, Debian, Fedora, Redhat, Gentoo), im Zeitraum 2009-2012 als Administrator

SEO

Ich verf ¨uge ¨uber viel Erfahrung in Suchmaschinenoptimierung/ SEO und Entwicklung entsprechender Client-Tools.

Background

Gerne auch Projekte mit ingenieurwissenschaftlichem (z.B. Signalverarbeitung, Integraltransformationen) und physikalischem Bezug (computational physics, fluid dynamics, s.o.), sofern eine substantielle U¨ berschneidungen mit meinem beschriebenen fachlichen Schwerpunkt existiert.

Beruflicher Werdegang

2009 - 2012:

Kunde: Universität Freiburg, Technische Fakultät, Institut für Mikrosystemtechnik, Lehrstuhl für Simulation

Rolle: Doktorand, Wissenschaftlicher Mitarbeiter/Doktorand im Bereich Computational Physics/Fluid Dynamics - Entwicklung von Simulatoren

Praktikum:

2002:

Kunde: IHM Engenharia e Sistemas de Automacao Ltda., Belo Horizonte, Brasilien

Betriebshaftpflicht:

ja

Betriebssysteme

Linux
Ubuntu, Debian, Fedora, Redhat, Gentoo

Programmiersprachen

Assembler
Bash/Shell
C#
C/C++
Gremlin
Java 8
Perl
PHP
Python

Datenbanken

Cassandra
Graph-Datenbanken
HBase
Hive
MySQL
Neo4J
NoSQL
Oracle
PostgreSQL
SQL
Titan

Branchen

Branchen

  • E-Commerce
  • IT-Dienstleistungen
  • Forschung
  • Industrie-Dienstleistungen
  • Medien
  • Umwelt/Gesundheitswesen
  • Konsumgüter/Halbleiter

Vertrauen Sie auf GULP

Im Bereich Freelancing
Im Bereich Arbeitnehmerüberlassung / Personalvermittlung

Fragen?

Rufen Sie uns an +49 89 500316-300 oder schreiben Sie uns:

Das GULP Freelancer-Portal

Direktester geht's nicht! Ganz einfach Freelancer finden und direkt Kontakt aufnehmen.