DevOps, Teamlead, CI/CD, AWS, Azure, Kubernetes, Docker,
Aktualisiert am 02.04.2025
Profil
Mitarbeiter eines Dienstleisters
Remote-Arbeit
Verfügbar ab: 03.04.2025
Verfügbar zu: 100%
davon vor Ort: 100%
Skill-Profil eines fest angestellten Mitarbeiters des Dienstleisters
Deutsch
Muttersprache
Englisch
Verhandlungssicher

Einsatzorte

Einsatzorte

Deutschland
möglich

Projekte

Projekte

1 Jahr 4 Monate
2024-01 - heute

DevOps Teamlead, Octostar LTD

DevOps Teamlead
DevOps Teamlead

    • Einführung, Aufbau und Schulung im Bereich Kubernetes EKS sowie deren relenaten Tools wie Kubernetes UI, k9, stern und LENS zum Debuggen von Anwendungen
    • Architektur und Aufbau eines Data Analytics Plattforms basierend auf Apache-Superset, Clickhouse, kind-kubernetes und GPU / CUDA Machine Learning aud AWS und auf Hetzner.
    • Streamlined deliverable of an Intelligence DATA ANALYTICS solution based on apache-superset, clickhouse, kind-kubernetes, GPU / CUDA Machine Learning on AWS and Hetzner premises.
    • Einführung von Infrastructure as Code (Iac) für alle neu und bestehende Infrastruktur mittels Ansible, Terraform, ArgoCD und Kubernetes Operatoren
    • Einsatz von Cilium als CNI (Container Network Interface) in Kubernetes-Clustern zur Optimierung der Netzwerksicherheit, Observability und Performance durch eBPF-basierte Netzwerk- und Sicherheitsrichtlinien

1 Jahr 4 Monate
2024-01 - heute

DevOps TeamLead, Contensi Software GmbH

DevOps TeamLead
DevOps TeamLead
  • Betreuung und Anleitung von zwei Junior DevOps-Kollegen. Förderung der beruflichen Entwicklung und Fähigkeiten des Teams.  
  • Leitung des Aufbaus eines Referenz-MinIO-Speicherclusters unter Verwendung von Rancher Kubernetes, um Robustheit und Skalierbarkeit für die Speicherinfrastruktur zu gewährleisten.
  • Extended changes to the Infoblox DNS system, review-ed and fixed the zones propagation
  • Maintainer von Ganeti (KVM Virtualisierung) Packet bei Gentoo
Contensi Software GmbH
2 Jahre 3 Monate
2023-02 - heute

Site Reliability & Security Engineer, Max Planck Institute

Site Reliability & Security Engineer
Site Reliability & Security Engineer
  • Implementierung von CI/CD-Pipelines mithilfe von GitLab für lokale und cloudbasierte Umgebungen, einschließlich AWS- und OpenStack-VMs, mit Orchestrierung durch Rancher
  • Verwaltung und Optimierung von OpenStack Nova für die Bereitstellung und Verwaltung von virtuellen Maschinen.
  • Nutzung von OpenStack Cinder zur Speicherverwaltung für persistente Volumes innerhalb der OpenStack-Umgebung.
  • Leitung des Prototypings eines verteilten Speichersystems unter Nutzung von MinIO sowie der Integration von JuiceFS für erweiterte Dateisystemfunktionen sowie die Integration mit Azure AD
  • Einführung von PortainerIO, um Abläufe zu rationalisieren und eine benutzerfreundliche Verwaltung für ein Team von technisch nicht versierten Benutzern zu erleichtern
  • Einführung von Dynatrace als einheitliche Logging/Monitoring System für OnPrem und Cloud Resourcen
  • Aufbau eines SIEM/SOC mittels Newrelic
  • Implementierung von OpenTelemetry für verteiltes Tracing und Metrik-Erfassung zur Optimierung der Systemtransparenz und Performance-Überwachung
  • Einsatz von Cilium als CNI für Rancher Kubernetes Cluster zur Optimierung der Netzwerksicherheit und Performance durch eBPF-basierte Netzwerk- und Sicherheitsrichtlinien
  • Aufbau der gesamten Infrastruktur as Code mittels Terraform CDK, Ansible und Kubernetes Operatoren
  • Erweiterte Änderungen am Infoblox-DNS-System, Überarbeitung und Korrektur der Zonenverschiebung
Max Planck Institute
5 Monate
2023-07 - 2023-11

Site Reliability & Security Engineer,Skycharge

Site Reliability & Security Engineer
Site Reliability & Security Engineer

    • Entwicklung einer Debian-Paketerweiterung für eine ANSI-C-Codebasis, optimiert für die Armh-Architektur (BeagleBoard) um Funktionalität und Kompatibilität zu verbessern.
    • Leitung der Einführung von Unit-Tests neben der Nutzung von GDB zur umfassenden Code-Validierung und Qualitätssicherung.

Skycharge
9 Monate
2022-11 - 2023-07

Security Engineer Team Lead, Prima Assicurazioni

Site Reliability & Security Engineer
Site Reliability & Security Engineer
  • Unterstützung von organisatorischen Umstrukturierungen als Wegbereiter für Veränderungen und geschickter Verhandlungsführer. Resultierend in nahtlose Übergange von Prozessen und einer verbesserten betrieblichen Effizienz. 
  • Behebung von Reibungspunkten und Unterstützung der Karriereerwartungen für ein Team von 12 Site Reliability Engineers (SREs) sowie weiteren 28 Fachleuten im gesamten Unternehmen.
  • Durchführung umfassender Überprüfungen von Data Warehouse-Prozessen und -Designs, wobei diese an den Prinzipien des Domain Driven Design ausgerichtet wurden, um Funktionalität und Skalierbarkeit zu optimieren.
  • Migration von Pulumi als Infrastructure as Code (IaC) zu Terraform sowie die Einführung vom Ansible für Konfigurationsmanagement
  • Implementierung von OpenTelemetry zur verbesserten Überwachung und Nachverfolgbarkeit von Systemmetriken und verteilten Traces innerhalb der Sicherheitsinfrastruktur
  • Identifizierung von Stakeholdern und Durchführung von gründlichen Überprüfungen der Geschäftsprozesse zur Sicherstellung der DSGVO-Vorschriften, wobei Datenschutz- und Sicherheitsmaßnahmen Vorrang hatten.

Prima Assicurazioni
9 Monate
2022-11 - 2023-07

Site Reliability Team-Lead,ClovrLabs

Site Reliability Team-Lead, Site Reliability & Security Engineer
Site Reliability Team-Lead, Site Reliability & Security Engineer

    • Fungieren als entscheidende Schlüsselfigur bei der Architektur einer Cloud-Native-Infrastruktur innerhalb einer Hybrid-Cloud-Umgebung und leitete gleichzeitig die Rekrutierung und nahtlose Einarbeitung eines kompetenten Teams von Vollzeitmitarbeitern (FTEs).
    • Bereitstellung fachkundiger Beratung zu Best Practices für die Cloud-Architektur bei einem renommierten Unternehmen für Blockchain-Reputation, um eine Ausrichtung an branchenüblichen Standards und optimale Leistung sicherzustellen.
    • Aufbau und Pflege eines robusten und skalierbaren AWS EKS (Kubernetes)-Setups, welches sich durch Effizienz, Sauberkeit und einfache Wartung auszeichnete.
    • Entwicklung von Lösungen zur Migration von VMware-basierten VMs auf -basierte Instanzen.
    • Implementierung von  als Speicherlösung für containerisierte Workloads und persistente Speicherschichten.
    • Durchführung von Echtzeit-Codeprofilen und Durchführung umfassender Last- und Leistungstests zur Optimierung der Systemleistung und Verbesserung der Zuverlässigkeit.
    • Bewertung der Dimensionierung der lokalen Infrastruktur, um eine optimale Ressourcenzuteilung und Effizienz sicherzustellen.
    • Entwurf und Inbetriebnahme einer ETL-Lösung (Extract, Transform, Load) mit Jupyter Notebooks und Spark, die eine effiziente Datenverarbeitung und -analyse ermöglicht.
    • Führung und Mentoring für ein Team von sechs DevOps/SRE-Fachleuten im gesamten Unternehmen, Förderung der Zusammenarbeit und Förderung der operativen Exzellenz

    Aufbau und Architektur eines verteilten Zero-Trust-Setups basierend auf Cloudflare-Tunnel und DNS/CDN-Diensten.

3 Jahre 9 Monate
2019-04 - 2022-12

Operations Teamlead, ATU

DevOps Engineer, Operations Teamlead
DevOps Engineer, Operations Teamlead
    • Bereitstellung umfassender Unterstützung bei der Wartung einer Hybrid-Cloud-Infrastruktur über einen Zeitraum von über vier Jahren, um einen reibungslosen Openshift Betrieb und optimale Leistung sicherzustellen
    • Diagnostizierung und Lösung von Problemen im Zusammenhang mit der Einrichtung des Active Directory Distributed File System (DFS)-Roamingprofils für den Lastausgleich unter Verwendung eines Prometheus Exporter für Windows-Maschinen
    • Integration von Active Directory (AD)-Authentifizierung über Kerberos auf Keycloak, um Single Sign-On (SSO) für verschiedene Dienste zu ermöglichen
    • Erleichterung der Migration und Verwaltung einer SPNEGO-basierten AD Single Sign-On (SSO)-Lösung auf NGINX-Endpunkten, um sichere und effiziente Authentifizierungsmechanismen zu gewährleisten.
    • Implementierung von ISO27001 Maßnahmen, insbesondere im Zusammenhang mit Container-Security, Rechenzentrum und Netzwerk Best Practices
    • Implementierung eines Ceph/Rook-Storage-Clusters auf Basis von Kubernetes sowie das Bereitstellen verschiedener Speichersysteme wie Block Storage, S3 und CephFS sowie die Wartung des Clusters mit ArgoCD und Ansible.
    • Nutzung von OpenStack Cinder zur Verwaltung von Block-Storage-Lösungen in Verbindung mit Ceph.
    • Optimierung und Automatisierung von OpenStack Nova für das Management von virtuellen Maschinen in einer Hybrid-Cloud-Umgebung.
    • Entwicklung von Automatisierungs- und Verwaltungstools mit Golang zur Optimierung von Kubernetes- und OpenStack-Workflows, insbesondere für Skalierungsmechanismen und Self-Healing-Prozesse
    • Einsatz von Crossplane zur Verwaltung und Provisionierung von Cloud-Ressourcen über verschiedene Umgebungen hinweg, um eine einheitliche, deklarative Infrastruktur für Kubernetes-basierte Workloads zu ermöglichen
    • Architektur und Aufbau einer Logging und Monitoring Lösung mittels Elasticsearch/Grafana/Prometheus/Fluentd
    • Architektur und Aufbau eines SOC und SIEM Architektur mittels Datadog samt Logging, Alerting und Monitoring von Anomalien und verdächtigen Netzwerk-Aktivitäten
1 Jahr
2020-04 - 2021-03

Security Engineer, HelloFresh

Security Engineer
Security Engineer

    • Implementierung und Verwaltung der CloudFlare Web Application Firewall (WAF) zur proaktiven Bedrohungsabwehr und Reaktion auf Vorfälle, sowie des auf AWS bereitgestellten ELK-Stacks (Elasticsearch, Logstash, Kibana) für umfassende Protokollanalyse und -überwachung
    • Überprüfung der Sicherheitsmaßnahmen gemäß BSI bzw. ISO 27001, insbesondere im Bereich der Container-Sicherheit, Identifizierung von Schwachstellen sowie Durchführung von Sicherheitsscans sowohl offline als auch online für Deployments.
    • Betrieb von Kubernetes und Openshift Instanzen für unterschiedliche Umgebungen

7 Monate
2019-06 - 2019-12

DevOps Team Lead, UMI Urban Mobility International GmbH

DevOps Team Lead
DevOps Team Lead

    • Unterstützung bei der Organisation während der Go-Live-Phase des Produkts und Sicherstellung der Betriebsbereitschaft der Infrastruktur um eine nahtlose Bereitstellung zu gewährleisten.
    • Implementierung und Wartung von OpenStack Nova zur Verwaltung von Cloud-Instanzen in einer skalierbaren Umgebung.
    • Integration von OpenStack Cinder zur effizienten Verwaltung von Speichervolumen für kritische Anwendungen.
    • Implementierung eines kennzahlbasierten Prozesses zur Bewertung der Produktqualität aus der Sicht des Endbenutzers, wodurch Ziele und Schlüsselergebnisse (OKRs) beeinflusst wurden.
    • Leitete die Aktivitäten eines Teams von 5 Site Reliability Engineers (SREs), überwachte deren Aufgaben und stellte die Ausrichtung auf die Unternehmensziele sicher.

1 Jahr 7 Monate
2017-11 - 2019-05

CTO, SiWeGO

CTO
CTO

  • Implementierung der CloudFlare Web Application Firewall (WAF) und Verwaltung von Incident Response-Verfahren sowie ELK-Stack-Bereitstellung auf AWS für eine umfassende Protokollanalyse.
  • Verwaltung von Lieferantenbeziehungen und Lieferantenpartnerschaften, um einen reibungslosen Betrieb und eine pünktliche Bereitstellung von Dienstleistungen sicherzustellen.
  • Entwicklung von Lösungen mit Fokus auf die Minimierung der Betriebsausgaben (OPEX) bei gleichbleibender hoher Leistung und Zuverlässigkeit.
  • Entwicklung algorithmischer Ansätze für die Gestaltung von Diagrammüberlappungen, um eine effiziente Indizierung und Abfrage von Daten sicherzustellen.

5 Monate
2018-10 - 2019-02

DevOps Engineer, ATU

DevOps Engineer
DevOps Engineer

    • Implementierung von Kubernetes mit Helm, ELK-Stack und Grafana/Prometheus unter Verwendung von Docker auf VMWARE/Xen-virtualisierten Systemen.
    • Verwaltung des Content Delivery Networks (CDN) zur Abwehr von Distributed Denial of Service (DDoS) und DNS-Management mit Schwerpunkt der Reduzierung der Angriffsfläche.
    • Durchführung einer Anwendungsleistungsüberwachung und Bewertung der gesamten Infrastrukturleistung zur Optimierung der Systemeffizienz.
    • Betriebsunterstützung von Openshift mittels Ansible Playbooks
    • Unterstützung von ETL-Prozessen (Extract, Transform, Load), um eine nahtlose Datenintegration und -verarbeitung sicherzustellen.

1 Jahr 11 Monate
2016-10 - 2018-08

Sr. Performance Engineer, OLX

Sr.Performance Engineer
Sr.Performance Engineer

    • Durchführung gründlicher Bewertungs und Auswahlprozesse für Anbieter von Content Delivery Network (CDN), Secure Sockets Layer (SSL) und Domain Name System (DNS) und Bereitstellung interner Schulungen und Beratung zu verwandten Themen innerhalb von OLX
    • Leitung von Last- und Leistungstestinitiativen und Überprüfung des architektonischen Leistungsdesigns, um die Systemeffizienz und -zuverlässigkeit zu optimieren
    • Entwicklung umfassender Kapazitätsplanungsstrategien für die Migration von Bare-Metal-Infrastrukturen zu Cloud-basierten Lösungen, um einen nahtlosen Übergang und Skalierbarkeit sicherzustellen
    • Entwicklung von leistungsoptimierten Tools und Automatisierungslösungen mit Golang zur Analyse und Verbesserung von Systemperformance und Netzwerkkommunikation
    • Entwicklung und Weiterpflegen der Linux-Server Landschaft mittels Ansible inklusiv Patch-Management und Implementierung von neuen Security-Anforderungen
    • Bereitstellung von Coaching und Unterstützung für über 50 Ingenieure im gesamten Unternehmen, Förderung der Kompetenzentwicklung und des Wissensaustauschs, um kontinuierliche Verbesserungen voranzutreiben

2 Jahre 11 Monate
2013-11 - 2016-09

Service Reliability Engineer, SonyPlaystation (?Playstation Now? service - GAIKAI)

Service Reliability Engineer
Service Reliability Engineer

  • Entwurf und Implementierung einer robusten Network Time Protocol (NTP)-Infrastruktur, um eine präzise Zeitsynchronisierung zwischen Systemen sicherzustellen
  • Verwaltung der Paketwartung von KVM/Ganeti Gentoo und Sicherstellung der Stabilität und Zuverlässigkeit der Virtualisierungsumgebung
  • Fachexperte für Hadoop und strategische Beratung, sowie technische Führung bei der Implementierung und Optimierung von Hadoop-basierten Lösungen
  • Entwicklung von CEPH-Speicherlösungen zur Bereitstellung einer skalierbaren, leistungsstarken Speicherinfrastruktur, die auf die Anforderungen des Unternehmens zugeschnitten ist.
  • Erhielt im ersten Quartal 2016 in New York City offizielles RH-Training "Red Hat Ceph Storage Architecture and Administration (CEPH125)" von J. C. Lopez.
  • Entwicklung von NFS-Speichersystemen zur Erzielung optimaler Leistung mit einem Durchsatz von 40 Mbit/s pro Client und einem Zielausgang von 46 Gbit/s von einem einzelnen Knoten, der das Rack bedient
  • Entwicklung einer domänenspezifischen Sprache (DSL) unter Verwendung der textX-Bibliothek für erweiterte Funktionalität und Flexibilität bei der Abfrage der Graphite-API
  • Bereitstellung umfassender Coaching- und Schulungsmaßnahmen für neue Mitarbeiter (5), um deren Integration in das Team zu erleichtern und die Kompetenz in ihren Rollen sicherzustellen
  • Einführung von Ansible als zentrale Konfigurationsmanagement-Tool für alle Linux-Server OnPrem

10 Monate
2012-10 - 2013-07

Sr.Data Architect, Rocket Internet

Sr.Software Engineer
Sr.Software Engineer

    • Agierte als System Operations (Sysop) und Entwickler für das Business Intelligence-Team und überwachte die kritische Infrastruktur und Softwareentwicklung.
    • Entwicklung und Implementierung eines Python-basierten FLASK Google Analytics API-Abrufers zum Sammeln und Verarbeiten von Daten für Analysezwecke.
    • Installierung, Konfiguration und Verwaltung eines Hadoop/MapR M3-Cluster bestehend aus 5 Knoten, der die Verarbeitung und Analyse großer Datenmengen erleichtert.
    • Integration von HIVE und SquirrelSQL über Thrift2/JDBC, um eine nahtlose Interaktion mit dem Hadoop-Ökosystem zu ermöglichen und um Datenwissenschaftlern effiziente Einblicke zu eröffnen.
    • Pionierarbeit für verschiedene Datenaufnahmepfade, die für Szenarien mit großer Entfernung und hoher Latenz optimiert sind und eine robuste Datenerfassung in verschiedenen Umgebungen gewährleisten.
    • Bereitstellung fachmännischer Unterstützung für das Team bei der Ausführung von ETL-Geschäftsprozessen (Extract, Transform, Load) und Optimierung von Daten-Workflows für mehr Effizienz und Genauigkeit.

1 Jahr 2 Monate
2011-07 - 2012-08

Backend QA Manager, ?txtr

Backend QA Manager
Backend QA Manager

    • Initiierung der Entwicklung von eBook-Lesetechnologie, spezialisiert auf Adobe DRM-bezogene Technologien
    • Durchführung von REST-API-Benutzerakzeptanz- und Last- und Leistungstests
    • Leitung von Notfall- und Ursachenanalysemaßnahmen bei kritischen Vorfällen
    • Implementierung von Betriebsüberwachungsstrategien, um die Systemstabilität und -leistung sicherzustellen
    • Versiert in der Programmierung mit Python, Ruby, C++ und Java
    • Entwicklung einer Ruby-basierten Testautomatisierungslösung unter Verwendung der Cucumber- und Selenium-Frameworks
    • Entwicklung einer XML-, XPATH- und XQUERY-Suchmaschine für effiziente Datenabfrage
    • Leitung einer Proof-of-Concept-Initiative mit Hadoop-Technologie
    • Durchführung von CDN- und RUM-Tests unter Nutzung JMX-basierter instrumentierter Metriken zur Leistungsbewertung
    • Durchführung von Code-Reviews zur Sicherstellung von Codequalität und Einhaltung bewährter Verfahren
    • Überwachung der Berichts- und Koordinierungsaktivitäten für ein Team von drei UAT-Ingenieuren

3 Monate
2011-04 - 2011-06

Sr.System Engineer, ProfiBricks

Sr.System Engineer
Sr.System Engineer

    • Implementierung einer Debian-basierten KVM-Private-Cloud-Lösung
    • Stellvertretender Leiter des Betriebsteams und Beaufsichtigung eines Teams von 6 Ingenieuren
    • Durchführung von Softwarepaketierungsaktivitäten
    • Python-Skripterstellung und Arbeit mit Konfigurationsmanagement-Tools wie bcfg2 und Puppet
    • Effektive Verwaltung von Überwachungs- und Sicherungsvorgängen

7 Monate
2010-10 - 2011-04

Sr.System Engineer, Nokia

Sr.System Engineer
Sr.System Engineer

    • Unterstützung von 7 verschiedenen Teams im Zusammenhang mit Nokia Maps / NAVTEQ in einer DevOps-Funktion
    • Einrichtung kontinuierlicher Integrationsprozesse
    • Paketierung für REDHAT/CentOS-Systeme
    • Skripterstellung in Python und Ruby und Nutzung von Konfigurationsmanagement-Tools wie Puppet bzw. Ansible
    • Abwicklung von Vorgängen im Zusammenhang mit Entwicklungs-Rechenzentren.

2 Jahre 6 Monate
2008-04 - 2010-09

Consultant ? Sr.Test Specialist, Vodafone

Consultant ? Sr.Tst Specialist
Consultant ? Sr.Tst Specialist

    • Sicherer Umgang mit Leistungstesttools wie Grinder, Apache Bench und JMeter
    • Erfahrung in der Implementierung von Testautomatisierungsmethoden.
    • Spielte eine Schlüsselrolle bei der erfolgreichen Umsetzung großer Projekte, darunter:
    • Vodafone Live! (J2EE basierte web mobile platform)
    • Vodafone 360 (Projekt mit einem geschätzten Budget von ca. 250 Millionen Euro)
    • Vodafone GIG (Tibco-basierte SOA-Infrastruktur)
    • Nachgewiesene Führungsqualitäten als Fachexperte, Koordinierung der Testaktivitäten innerhalb eines Teams von 10 QA-Ingenieuren

Kompetenzen

Kompetenzen

Produkte / Standards / Erfahrungen / Methoden

MSDos
win31
XP
10
11
NT
Kerberos
LDAP
CDN Management
SSL
DNS Infrastructure Design
OpenID Connect (OIDC)
F5 BigIP
Traefik
GSM
Over the Air
Akamai
Cloudflare
Tunnels
DNS
TCP/IP
PXE/TFTP
AWS
NLB
ALB
ELB
Apache
Juniper
ARP
Azore Storage technologies
MinIO
Kubernetes Storage (CSI)
Hadoop, CEPH
NFS Storage Design
Hadoop DFS
GlusterFS
AndrewFS
Mixrosoft DFS/Samba
NFS
iSCSI
ELK Stack
Grafana
Prometheus.io
Datadog
Nagios
Nagiosgrapher
SumoLogic
WAF
SSO
Bot detection
Datadome
Azure AD (Entra ID)
SAML
x509
GitOps
Kubernetes
Rancher
GitLab CI/CD
Docker
VMware/Xen Virtualized Systems
Mobile Load
Testing
Continuous Integration Setup
AWS EKS
EC2
VPC
S3
Cloud Native Architecture Design
Hybrid Cloud
Helm
GitOp
NginX
Vault
Sealed secrets
CoreDNS
MongoDB
MySQL
Oracle
PostgreSQL
Redis
Hbase
Hive
eXist
XPath
CouchBase
memcached
Agile
Scrum
ESX
KVM/Ganeti
Terraform
Pulumi
Ansible
Puppet
Bfcg2
Chef
CFEngine
Salt
Debian-Based Private Cloud Solution
Linux Administration
Red Hat/CentOS Packaging
Ubuntu
Debian
Fedora

Programmiersprachen

C
PHP
Python
Ruby
SQL
Java
Jython
C++
XML
XSLT
EJB
Go
Erlang
Perl

Einsatzorte

Einsatzorte

Deutschland
möglich

Projekte

Projekte

1 Jahr 4 Monate
2024-01 - heute

DevOps Teamlead, Octostar LTD

DevOps Teamlead
DevOps Teamlead

    • Einführung, Aufbau und Schulung im Bereich Kubernetes EKS sowie deren relenaten Tools wie Kubernetes UI, k9, stern und LENS zum Debuggen von Anwendungen
    • Architektur und Aufbau eines Data Analytics Plattforms basierend auf Apache-Superset, Clickhouse, kind-kubernetes und GPU / CUDA Machine Learning aud AWS und auf Hetzner.
    • Streamlined deliverable of an Intelligence DATA ANALYTICS solution based on apache-superset, clickhouse, kind-kubernetes, GPU / CUDA Machine Learning on AWS and Hetzner premises.
    • Einführung von Infrastructure as Code (Iac) für alle neu und bestehende Infrastruktur mittels Ansible, Terraform, ArgoCD und Kubernetes Operatoren
    • Einsatz von Cilium als CNI (Container Network Interface) in Kubernetes-Clustern zur Optimierung der Netzwerksicherheit, Observability und Performance durch eBPF-basierte Netzwerk- und Sicherheitsrichtlinien

1 Jahr 4 Monate
2024-01 - heute

DevOps TeamLead, Contensi Software GmbH

DevOps TeamLead
DevOps TeamLead
  • Betreuung und Anleitung von zwei Junior DevOps-Kollegen. Förderung der beruflichen Entwicklung und Fähigkeiten des Teams.  
  • Leitung des Aufbaus eines Referenz-MinIO-Speicherclusters unter Verwendung von Rancher Kubernetes, um Robustheit und Skalierbarkeit für die Speicherinfrastruktur zu gewährleisten.
  • Extended changes to the Infoblox DNS system, review-ed and fixed the zones propagation
  • Maintainer von Ganeti (KVM Virtualisierung) Packet bei Gentoo
Contensi Software GmbH
2 Jahre 3 Monate
2023-02 - heute

Site Reliability & Security Engineer, Max Planck Institute

Site Reliability & Security Engineer
Site Reliability & Security Engineer
  • Implementierung von CI/CD-Pipelines mithilfe von GitLab für lokale und cloudbasierte Umgebungen, einschließlich AWS- und OpenStack-VMs, mit Orchestrierung durch Rancher
  • Verwaltung und Optimierung von OpenStack Nova für die Bereitstellung und Verwaltung von virtuellen Maschinen.
  • Nutzung von OpenStack Cinder zur Speicherverwaltung für persistente Volumes innerhalb der OpenStack-Umgebung.
  • Leitung des Prototypings eines verteilten Speichersystems unter Nutzung von MinIO sowie der Integration von JuiceFS für erweiterte Dateisystemfunktionen sowie die Integration mit Azure AD
  • Einführung von PortainerIO, um Abläufe zu rationalisieren und eine benutzerfreundliche Verwaltung für ein Team von technisch nicht versierten Benutzern zu erleichtern
  • Einführung von Dynatrace als einheitliche Logging/Monitoring System für OnPrem und Cloud Resourcen
  • Aufbau eines SIEM/SOC mittels Newrelic
  • Implementierung von OpenTelemetry für verteiltes Tracing und Metrik-Erfassung zur Optimierung der Systemtransparenz und Performance-Überwachung
  • Einsatz von Cilium als CNI für Rancher Kubernetes Cluster zur Optimierung der Netzwerksicherheit und Performance durch eBPF-basierte Netzwerk- und Sicherheitsrichtlinien
  • Aufbau der gesamten Infrastruktur as Code mittels Terraform CDK, Ansible und Kubernetes Operatoren
  • Erweiterte Änderungen am Infoblox-DNS-System, Überarbeitung und Korrektur der Zonenverschiebung
Max Planck Institute
5 Monate
2023-07 - 2023-11

Site Reliability & Security Engineer,Skycharge

Site Reliability & Security Engineer
Site Reliability & Security Engineer

    • Entwicklung einer Debian-Paketerweiterung für eine ANSI-C-Codebasis, optimiert für die Armh-Architektur (BeagleBoard) um Funktionalität und Kompatibilität zu verbessern.
    • Leitung der Einführung von Unit-Tests neben der Nutzung von GDB zur umfassenden Code-Validierung und Qualitätssicherung.

Skycharge
9 Monate
2022-11 - 2023-07

Security Engineer Team Lead, Prima Assicurazioni

Site Reliability & Security Engineer
Site Reliability & Security Engineer
  • Unterstützung von organisatorischen Umstrukturierungen als Wegbereiter für Veränderungen und geschickter Verhandlungsführer. Resultierend in nahtlose Übergange von Prozessen und einer verbesserten betrieblichen Effizienz. 
  • Behebung von Reibungspunkten und Unterstützung der Karriereerwartungen für ein Team von 12 Site Reliability Engineers (SREs) sowie weiteren 28 Fachleuten im gesamten Unternehmen.
  • Durchführung umfassender Überprüfungen von Data Warehouse-Prozessen und -Designs, wobei diese an den Prinzipien des Domain Driven Design ausgerichtet wurden, um Funktionalität und Skalierbarkeit zu optimieren.
  • Migration von Pulumi als Infrastructure as Code (IaC) zu Terraform sowie die Einführung vom Ansible für Konfigurationsmanagement
  • Implementierung von OpenTelemetry zur verbesserten Überwachung und Nachverfolgbarkeit von Systemmetriken und verteilten Traces innerhalb der Sicherheitsinfrastruktur
  • Identifizierung von Stakeholdern und Durchführung von gründlichen Überprüfungen der Geschäftsprozesse zur Sicherstellung der DSGVO-Vorschriften, wobei Datenschutz- und Sicherheitsmaßnahmen Vorrang hatten.

Prima Assicurazioni
9 Monate
2022-11 - 2023-07

Site Reliability Team-Lead,ClovrLabs

Site Reliability Team-Lead, Site Reliability & Security Engineer
Site Reliability Team-Lead, Site Reliability & Security Engineer

    • Fungieren als entscheidende Schlüsselfigur bei der Architektur einer Cloud-Native-Infrastruktur innerhalb einer Hybrid-Cloud-Umgebung und leitete gleichzeitig die Rekrutierung und nahtlose Einarbeitung eines kompetenten Teams von Vollzeitmitarbeitern (FTEs).
    • Bereitstellung fachkundiger Beratung zu Best Practices für die Cloud-Architektur bei einem renommierten Unternehmen für Blockchain-Reputation, um eine Ausrichtung an branchenüblichen Standards und optimale Leistung sicherzustellen.
    • Aufbau und Pflege eines robusten und skalierbaren AWS EKS (Kubernetes)-Setups, welches sich durch Effizienz, Sauberkeit und einfache Wartung auszeichnete.
    • Entwicklung von Lösungen zur Migration von VMware-basierten VMs auf -basierte Instanzen.
    • Implementierung von  als Speicherlösung für containerisierte Workloads und persistente Speicherschichten.
    • Durchführung von Echtzeit-Codeprofilen und Durchführung umfassender Last- und Leistungstests zur Optimierung der Systemleistung und Verbesserung der Zuverlässigkeit.
    • Bewertung der Dimensionierung der lokalen Infrastruktur, um eine optimale Ressourcenzuteilung und Effizienz sicherzustellen.
    • Entwurf und Inbetriebnahme einer ETL-Lösung (Extract, Transform, Load) mit Jupyter Notebooks und Spark, die eine effiziente Datenverarbeitung und -analyse ermöglicht.
    • Führung und Mentoring für ein Team von sechs DevOps/SRE-Fachleuten im gesamten Unternehmen, Förderung der Zusammenarbeit und Förderung der operativen Exzellenz

    Aufbau und Architektur eines verteilten Zero-Trust-Setups basierend auf Cloudflare-Tunnel und DNS/CDN-Diensten.

3 Jahre 9 Monate
2019-04 - 2022-12

Operations Teamlead, ATU

DevOps Engineer, Operations Teamlead
DevOps Engineer, Operations Teamlead
    • Bereitstellung umfassender Unterstützung bei der Wartung einer Hybrid-Cloud-Infrastruktur über einen Zeitraum von über vier Jahren, um einen reibungslosen Openshift Betrieb und optimale Leistung sicherzustellen
    • Diagnostizierung und Lösung von Problemen im Zusammenhang mit der Einrichtung des Active Directory Distributed File System (DFS)-Roamingprofils für den Lastausgleich unter Verwendung eines Prometheus Exporter für Windows-Maschinen
    • Integration von Active Directory (AD)-Authentifizierung über Kerberos auf Keycloak, um Single Sign-On (SSO) für verschiedene Dienste zu ermöglichen
    • Erleichterung der Migration und Verwaltung einer SPNEGO-basierten AD Single Sign-On (SSO)-Lösung auf NGINX-Endpunkten, um sichere und effiziente Authentifizierungsmechanismen zu gewährleisten.
    • Implementierung von ISO27001 Maßnahmen, insbesondere im Zusammenhang mit Container-Security, Rechenzentrum und Netzwerk Best Practices
    • Implementierung eines Ceph/Rook-Storage-Clusters auf Basis von Kubernetes sowie das Bereitstellen verschiedener Speichersysteme wie Block Storage, S3 und CephFS sowie die Wartung des Clusters mit ArgoCD und Ansible.
    • Nutzung von OpenStack Cinder zur Verwaltung von Block-Storage-Lösungen in Verbindung mit Ceph.
    • Optimierung und Automatisierung von OpenStack Nova für das Management von virtuellen Maschinen in einer Hybrid-Cloud-Umgebung.
    • Entwicklung von Automatisierungs- und Verwaltungstools mit Golang zur Optimierung von Kubernetes- und OpenStack-Workflows, insbesondere für Skalierungsmechanismen und Self-Healing-Prozesse
    • Einsatz von Crossplane zur Verwaltung und Provisionierung von Cloud-Ressourcen über verschiedene Umgebungen hinweg, um eine einheitliche, deklarative Infrastruktur für Kubernetes-basierte Workloads zu ermöglichen
    • Architektur und Aufbau einer Logging und Monitoring Lösung mittels Elasticsearch/Grafana/Prometheus/Fluentd
    • Architektur und Aufbau eines SOC und SIEM Architektur mittels Datadog samt Logging, Alerting und Monitoring von Anomalien und verdächtigen Netzwerk-Aktivitäten
1 Jahr
2020-04 - 2021-03

Security Engineer, HelloFresh

Security Engineer
Security Engineer

    • Implementierung und Verwaltung der CloudFlare Web Application Firewall (WAF) zur proaktiven Bedrohungsabwehr und Reaktion auf Vorfälle, sowie des auf AWS bereitgestellten ELK-Stacks (Elasticsearch, Logstash, Kibana) für umfassende Protokollanalyse und -überwachung
    • Überprüfung der Sicherheitsmaßnahmen gemäß BSI bzw. ISO 27001, insbesondere im Bereich der Container-Sicherheit, Identifizierung von Schwachstellen sowie Durchführung von Sicherheitsscans sowohl offline als auch online für Deployments.
    • Betrieb von Kubernetes und Openshift Instanzen für unterschiedliche Umgebungen

7 Monate
2019-06 - 2019-12

DevOps Team Lead, UMI Urban Mobility International GmbH

DevOps Team Lead
DevOps Team Lead

    • Unterstützung bei der Organisation während der Go-Live-Phase des Produkts und Sicherstellung der Betriebsbereitschaft der Infrastruktur um eine nahtlose Bereitstellung zu gewährleisten.
    • Implementierung und Wartung von OpenStack Nova zur Verwaltung von Cloud-Instanzen in einer skalierbaren Umgebung.
    • Integration von OpenStack Cinder zur effizienten Verwaltung von Speichervolumen für kritische Anwendungen.
    • Implementierung eines kennzahlbasierten Prozesses zur Bewertung der Produktqualität aus der Sicht des Endbenutzers, wodurch Ziele und Schlüsselergebnisse (OKRs) beeinflusst wurden.
    • Leitete die Aktivitäten eines Teams von 5 Site Reliability Engineers (SREs), überwachte deren Aufgaben und stellte die Ausrichtung auf die Unternehmensziele sicher.

1 Jahr 7 Monate
2017-11 - 2019-05

CTO, SiWeGO

CTO
CTO

  • Implementierung der CloudFlare Web Application Firewall (WAF) und Verwaltung von Incident Response-Verfahren sowie ELK-Stack-Bereitstellung auf AWS für eine umfassende Protokollanalyse.
  • Verwaltung von Lieferantenbeziehungen und Lieferantenpartnerschaften, um einen reibungslosen Betrieb und eine pünktliche Bereitstellung von Dienstleistungen sicherzustellen.
  • Entwicklung von Lösungen mit Fokus auf die Minimierung der Betriebsausgaben (OPEX) bei gleichbleibender hoher Leistung und Zuverlässigkeit.
  • Entwicklung algorithmischer Ansätze für die Gestaltung von Diagrammüberlappungen, um eine effiziente Indizierung und Abfrage von Daten sicherzustellen.

5 Monate
2018-10 - 2019-02

DevOps Engineer, ATU

DevOps Engineer
DevOps Engineer

    • Implementierung von Kubernetes mit Helm, ELK-Stack und Grafana/Prometheus unter Verwendung von Docker auf VMWARE/Xen-virtualisierten Systemen.
    • Verwaltung des Content Delivery Networks (CDN) zur Abwehr von Distributed Denial of Service (DDoS) und DNS-Management mit Schwerpunkt der Reduzierung der Angriffsfläche.
    • Durchführung einer Anwendungsleistungsüberwachung und Bewertung der gesamten Infrastrukturleistung zur Optimierung der Systemeffizienz.
    • Betriebsunterstützung von Openshift mittels Ansible Playbooks
    • Unterstützung von ETL-Prozessen (Extract, Transform, Load), um eine nahtlose Datenintegration und -verarbeitung sicherzustellen.

1 Jahr 11 Monate
2016-10 - 2018-08

Sr. Performance Engineer, OLX

Sr.Performance Engineer
Sr.Performance Engineer

    • Durchführung gründlicher Bewertungs und Auswahlprozesse für Anbieter von Content Delivery Network (CDN), Secure Sockets Layer (SSL) und Domain Name System (DNS) und Bereitstellung interner Schulungen und Beratung zu verwandten Themen innerhalb von OLX
    • Leitung von Last- und Leistungstestinitiativen und Überprüfung des architektonischen Leistungsdesigns, um die Systemeffizienz und -zuverlässigkeit zu optimieren
    • Entwicklung umfassender Kapazitätsplanungsstrategien für die Migration von Bare-Metal-Infrastrukturen zu Cloud-basierten Lösungen, um einen nahtlosen Übergang und Skalierbarkeit sicherzustellen
    • Entwicklung von leistungsoptimierten Tools und Automatisierungslösungen mit Golang zur Analyse und Verbesserung von Systemperformance und Netzwerkkommunikation
    • Entwicklung und Weiterpflegen der Linux-Server Landschaft mittels Ansible inklusiv Patch-Management und Implementierung von neuen Security-Anforderungen
    • Bereitstellung von Coaching und Unterstützung für über 50 Ingenieure im gesamten Unternehmen, Förderung der Kompetenzentwicklung und des Wissensaustauschs, um kontinuierliche Verbesserungen voranzutreiben

2 Jahre 11 Monate
2013-11 - 2016-09

Service Reliability Engineer, SonyPlaystation (?Playstation Now? service - GAIKAI)

Service Reliability Engineer
Service Reliability Engineer

  • Entwurf und Implementierung einer robusten Network Time Protocol (NTP)-Infrastruktur, um eine präzise Zeitsynchronisierung zwischen Systemen sicherzustellen
  • Verwaltung der Paketwartung von KVM/Ganeti Gentoo und Sicherstellung der Stabilität und Zuverlässigkeit der Virtualisierungsumgebung
  • Fachexperte für Hadoop und strategische Beratung, sowie technische Führung bei der Implementierung und Optimierung von Hadoop-basierten Lösungen
  • Entwicklung von CEPH-Speicherlösungen zur Bereitstellung einer skalierbaren, leistungsstarken Speicherinfrastruktur, die auf die Anforderungen des Unternehmens zugeschnitten ist.
  • Erhielt im ersten Quartal 2016 in New York City offizielles RH-Training "Red Hat Ceph Storage Architecture and Administration (CEPH125)" von J. C. Lopez.
  • Entwicklung von NFS-Speichersystemen zur Erzielung optimaler Leistung mit einem Durchsatz von 40 Mbit/s pro Client und einem Zielausgang von 46 Gbit/s von einem einzelnen Knoten, der das Rack bedient
  • Entwicklung einer domänenspezifischen Sprache (DSL) unter Verwendung der textX-Bibliothek für erweiterte Funktionalität und Flexibilität bei der Abfrage der Graphite-API
  • Bereitstellung umfassender Coaching- und Schulungsmaßnahmen für neue Mitarbeiter (5), um deren Integration in das Team zu erleichtern und die Kompetenz in ihren Rollen sicherzustellen
  • Einführung von Ansible als zentrale Konfigurationsmanagement-Tool für alle Linux-Server OnPrem

10 Monate
2012-10 - 2013-07

Sr.Data Architect, Rocket Internet

Sr.Software Engineer
Sr.Software Engineer

    • Agierte als System Operations (Sysop) und Entwickler für das Business Intelligence-Team und überwachte die kritische Infrastruktur und Softwareentwicklung.
    • Entwicklung und Implementierung eines Python-basierten FLASK Google Analytics API-Abrufers zum Sammeln und Verarbeiten von Daten für Analysezwecke.
    • Installierung, Konfiguration und Verwaltung eines Hadoop/MapR M3-Cluster bestehend aus 5 Knoten, der die Verarbeitung und Analyse großer Datenmengen erleichtert.
    • Integration von HIVE und SquirrelSQL über Thrift2/JDBC, um eine nahtlose Interaktion mit dem Hadoop-Ökosystem zu ermöglichen und um Datenwissenschaftlern effiziente Einblicke zu eröffnen.
    • Pionierarbeit für verschiedene Datenaufnahmepfade, die für Szenarien mit großer Entfernung und hoher Latenz optimiert sind und eine robuste Datenerfassung in verschiedenen Umgebungen gewährleisten.
    • Bereitstellung fachmännischer Unterstützung für das Team bei der Ausführung von ETL-Geschäftsprozessen (Extract, Transform, Load) und Optimierung von Daten-Workflows für mehr Effizienz und Genauigkeit.

1 Jahr 2 Monate
2011-07 - 2012-08

Backend QA Manager, ?txtr

Backend QA Manager
Backend QA Manager

    • Initiierung der Entwicklung von eBook-Lesetechnologie, spezialisiert auf Adobe DRM-bezogene Technologien
    • Durchführung von REST-API-Benutzerakzeptanz- und Last- und Leistungstests
    • Leitung von Notfall- und Ursachenanalysemaßnahmen bei kritischen Vorfällen
    • Implementierung von Betriebsüberwachungsstrategien, um die Systemstabilität und -leistung sicherzustellen
    • Versiert in der Programmierung mit Python, Ruby, C++ und Java
    • Entwicklung einer Ruby-basierten Testautomatisierungslösung unter Verwendung der Cucumber- und Selenium-Frameworks
    • Entwicklung einer XML-, XPATH- und XQUERY-Suchmaschine für effiziente Datenabfrage
    • Leitung einer Proof-of-Concept-Initiative mit Hadoop-Technologie
    • Durchführung von CDN- und RUM-Tests unter Nutzung JMX-basierter instrumentierter Metriken zur Leistungsbewertung
    • Durchführung von Code-Reviews zur Sicherstellung von Codequalität und Einhaltung bewährter Verfahren
    • Überwachung der Berichts- und Koordinierungsaktivitäten für ein Team von drei UAT-Ingenieuren

3 Monate
2011-04 - 2011-06

Sr.System Engineer, ProfiBricks

Sr.System Engineer
Sr.System Engineer

    • Implementierung einer Debian-basierten KVM-Private-Cloud-Lösung
    • Stellvertretender Leiter des Betriebsteams und Beaufsichtigung eines Teams von 6 Ingenieuren
    • Durchführung von Softwarepaketierungsaktivitäten
    • Python-Skripterstellung und Arbeit mit Konfigurationsmanagement-Tools wie bcfg2 und Puppet
    • Effektive Verwaltung von Überwachungs- und Sicherungsvorgängen

7 Monate
2010-10 - 2011-04

Sr.System Engineer, Nokia

Sr.System Engineer
Sr.System Engineer

    • Unterstützung von 7 verschiedenen Teams im Zusammenhang mit Nokia Maps / NAVTEQ in einer DevOps-Funktion
    • Einrichtung kontinuierlicher Integrationsprozesse
    • Paketierung für REDHAT/CentOS-Systeme
    • Skripterstellung in Python und Ruby und Nutzung von Konfigurationsmanagement-Tools wie Puppet bzw. Ansible
    • Abwicklung von Vorgängen im Zusammenhang mit Entwicklungs-Rechenzentren.

2 Jahre 6 Monate
2008-04 - 2010-09

Consultant ? Sr.Test Specialist, Vodafone

Consultant ? Sr.Tst Specialist
Consultant ? Sr.Tst Specialist

    • Sicherer Umgang mit Leistungstesttools wie Grinder, Apache Bench und JMeter
    • Erfahrung in der Implementierung von Testautomatisierungsmethoden.
    • Spielte eine Schlüsselrolle bei der erfolgreichen Umsetzung großer Projekte, darunter:
    • Vodafone Live! (J2EE basierte web mobile platform)
    • Vodafone 360 (Projekt mit einem geschätzten Budget von ca. 250 Millionen Euro)
    • Vodafone GIG (Tibco-basierte SOA-Infrastruktur)
    • Nachgewiesene Führungsqualitäten als Fachexperte, Koordinierung der Testaktivitäten innerhalb eines Teams von 10 QA-Ingenieuren

Kompetenzen

Kompetenzen

Produkte / Standards / Erfahrungen / Methoden

MSDos
win31
XP
10
11
NT
Kerberos
LDAP
CDN Management
SSL
DNS Infrastructure Design
OpenID Connect (OIDC)
F5 BigIP
Traefik
GSM
Over the Air
Akamai
Cloudflare
Tunnels
DNS
TCP/IP
PXE/TFTP
AWS
NLB
ALB
ELB
Apache
Juniper
ARP
Azore Storage technologies
MinIO
Kubernetes Storage (CSI)
Hadoop, CEPH
NFS Storage Design
Hadoop DFS
GlusterFS
AndrewFS
Mixrosoft DFS/Samba
NFS
iSCSI
ELK Stack
Grafana
Prometheus.io
Datadog
Nagios
Nagiosgrapher
SumoLogic
WAF
SSO
Bot detection
Datadome
Azure AD (Entra ID)
SAML
x509
GitOps
Kubernetes
Rancher
GitLab CI/CD
Docker
VMware/Xen Virtualized Systems
Mobile Load
Testing
Continuous Integration Setup
AWS EKS
EC2
VPC
S3
Cloud Native Architecture Design
Hybrid Cloud
Helm
GitOp
NginX
Vault
Sealed secrets
CoreDNS
MongoDB
MySQL
Oracle
PostgreSQL
Redis
Hbase
Hive
eXist
XPath
CouchBase
memcached
Agile
Scrum
ESX
KVM/Ganeti
Terraform
Pulumi
Ansible
Puppet
Bfcg2
Chef
CFEngine
Salt
Debian-Based Private Cloud Solution
Linux Administration
Red Hat/CentOS Packaging
Ubuntu
Debian
Fedora

Programmiersprachen

C
PHP
Python
Ruby
SQL
Java
Jython
C++
XML
XSLT
EJB
Go
Erlang
Perl

Vertrauen Sie auf Randstad

Im Bereich Freelancing
Im Bereich Arbeitnehmerüberlassung / Personalvermittlung

Fragen?

Rufen Sie uns an +49 89 500316-300 oder schreiben Sie uns:

Das Freelancer-Portal

Direktester geht's nicht! Ganz einfach Freelancer finden und direkt Kontakt aufnehmen.