Skill-Profil eines fest angestellten Mitarbeiters des Dienstleisters
Deutsch
Muttersprache
Englisch
Verhandlungssicher
Einsatzorte
Einsatzorte
Deutschland
möglich
Projekte
Projekte
1 Jahr 4 Monate
2024-01 - heute
DevOps Teamlead, Octostar LTD
DevOps Teamlead
DevOps Teamlead
Einführung, Aufbau und Schulung im Bereich Kubernetes EKS sowie deren relenaten Tools wie Kubernetes UI, k9, stern und LENS zum Debuggen von Anwendungen
Architektur und Aufbau eines Data Analytics Plattforms basierend auf Apache-Superset, Clickhouse, kind-kubernetes und GPU / CUDA Machine Learning aud AWS und auf Hetzner.
Streamlined deliverable of an Intelligence DATA ANALYTICS solution based on apache-superset, clickhouse, kind-kubernetes, GPU / CUDA Machine Learning on AWS and Hetzner premises.
Einführung von Infrastructure as Code (Iac) für alle neu und bestehende Infrastruktur mittels Ansible, Terraform, ArgoCD und Kubernetes Operatoren
Einsatz von Cilium als CNI (Container Network Interface) in Kubernetes-Clustern zur Optimierung der Netzwerksicherheit, Observability und Performance durch eBPF-basierte Netzwerk- und Sicherheitsrichtlinien
1 Jahr 4 Monate
2024-01 - heute
DevOps TeamLead, Contensi Software GmbH
DevOps TeamLead
DevOps TeamLead
Betreuung und Anleitung von zwei Junior DevOps-Kollegen. Förderung der beruflichen Entwicklung und Fähigkeiten des Teams.
Leitung des Aufbaus eines Referenz-MinIO-Speicherclusters unter Verwendung von Rancher Kubernetes, um Robustheit und Skalierbarkeit für die Speicherinfrastruktur zu gewährleisten.
Extended changes to the Infoblox DNS system, review-ed and fixed the zones propagation
Maintainer von Ganeti (KVM Virtualisierung) Packet bei Gentoo
Contensi Software GmbH
2 Jahre 3 Monate
2023-02 - heute
Site Reliability & Security Engineer, Max Planck Institute
Site Reliability & Security Engineer
Site Reliability & Security Engineer
Implementierung von CI/CD-Pipelines mithilfe von GitLab für lokale und cloudbasierte Umgebungen, einschließlich AWS- und OpenStack-VMs, mit Orchestrierung durch Rancher
Verwaltung und Optimierung von OpenStack Nova für die Bereitstellung und Verwaltung von virtuellen Maschinen.
Nutzung von OpenStack Cinder zur Speicherverwaltung für persistente Volumes innerhalb der OpenStack-Umgebung.
Leitung des Prototypings eines verteilten Speichersystems unter Nutzung von MinIO sowie der Integration von JuiceFS für erweiterte Dateisystemfunktionen sowie die Integration mit Azure AD
Einführung von PortainerIO, um Abläufe zu rationalisieren und eine benutzerfreundliche Verwaltung für ein Team von technisch nicht versierten Benutzern zu erleichtern
Einführung von Dynatrace als einheitliche Logging/Monitoring System für OnPrem und Cloud Resourcen
Aufbau eines SIEM/SOC mittels Newrelic
Implementierung von OpenTelemetry für verteiltes Tracing und Metrik-Erfassung zur Optimierung der Systemtransparenz und Performance-Überwachung
Einsatz von Cilium als CNI für Rancher Kubernetes Cluster zur Optimierung der Netzwerksicherheit und Performance durch eBPF-basierte Netzwerk- und Sicherheitsrichtlinien
Aufbau der gesamten Infrastruktur as Code mittels Terraform CDK, Ansible und Kubernetes Operatoren
Erweiterte Änderungen am Infoblox-DNS-System, Überarbeitung und Korrektur der Zonenverschiebung
Max Planck Institute
5 Monate
2023-07 - 2023-11
Site Reliability & Security Engineer,Skycharge
Site Reliability & Security Engineer
Site Reliability & Security Engineer
Entwicklung einer Debian-Paketerweiterung für eine ANSI-C-Codebasis, optimiert für die Armh-Architektur (BeagleBoard) um Funktionalität und Kompatibilität zu verbessern.
Leitung der Einführung von Unit-Tests neben der Nutzung von GDB zur umfassenden Code-Validierung und Qualitätssicherung.
Skycharge
9 Monate
2022-11 - 2023-07
Security Engineer Team Lead, Prima Assicurazioni
Site Reliability & Security Engineer
Site Reliability & Security Engineer
Unterstützung von organisatorischen Umstrukturierungen als Wegbereiter für Veränderungen und geschickter Verhandlungsführer. Resultierend in nahtlose Übergange von Prozessen und einer verbesserten betrieblichen Effizienz.
Behebung von Reibungspunkten und Unterstützung der Karriereerwartungen für ein Team von 12 Site Reliability Engineers (SREs) sowie weiteren 28 Fachleuten im gesamten Unternehmen.
Durchführung umfassender Überprüfungen von Data Warehouse-Prozessen und -Designs, wobei diese an den Prinzipien des Domain Driven Design ausgerichtet wurden, um Funktionalität und Skalierbarkeit zu optimieren.
Migration von Pulumi als Infrastructure as Code (IaC) zu Terraform sowie die Einführung vom Ansible für Konfigurationsmanagement
Implementierung von OpenTelemetry zur verbesserten Überwachung und Nachverfolgbarkeit von Systemmetriken und verteilten Traces innerhalb der Sicherheitsinfrastruktur
Identifizierung von Stakeholdern und Durchführung von gründlichen Überprüfungen der Geschäftsprozesse zur Sicherstellung der DSGVO-Vorschriften, wobei Datenschutz- und Sicherheitsmaßnahmen Vorrang hatten.
Prima Assicurazioni
9 Monate
2022-11 - 2023-07
Site Reliability Team-Lead,ClovrLabs
Site Reliability Team-Lead, Site Reliability & Security Engineer
Site Reliability Team-Lead, Site Reliability & Security Engineer
Fungieren als entscheidende Schlüsselfigur bei der Architektur einer Cloud-Native-Infrastruktur innerhalb einer Hybrid-Cloud-Umgebung und leitete gleichzeitig die Rekrutierung und nahtlose Einarbeitung eines kompetenten Teams von Vollzeitmitarbeitern (FTEs).
Bereitstellung fachkundiger Beratung zu Best Practices für die Cloud-Architektur bei einem renommierten Unternehmen für Blockchain-Reputation, um eine Ausrichtung an branchenüblichen Standards und optimale Leistung sicherzustellen.
Aufbau und Pflege eines robusten und skalierbaren AWS EKS (Kubernetes)-Setups, welches sich durch Effizienz, Sauberkeit und einfache Wartung auszeichnete.
Entwicklung von Lösungen zur Migration von VMware-basierten VMs auf -basierte Instanzen.
Implementierung von als Speicherlösung für containerisierte Workloads und persistente Speicherschichten.
Durchführung von Echtzeit-Codeprofilen und Durchführung umfassender Last- und Leistungstests zur Optimierung der Systemleistung und Verbesserung der Zuverlässigkeit.
Bewertung der Dimensionierung der lokalen Infrastruktur, um eine optimale Ressourcenzuteilung und Effizienz sicherzustellen.
Entwurf und Inbetriebnahme einer ETL-Lösung (Extract, Transform, Load) mit Jupyter Notebooks und Spark, die eine effiziente Datenverarbeitung und -analyse ermöglicht.
Führung und Mentoring für ein Team von sechs DevOps/SRE-Fachleuten im gesamten Unternehmen, Förderung der Zusammenarbeit und Förderung der operativen Exzellenz
Aufbau und Architektur eines verteilten Zero-Trust-Setups basierend auf Cloudflare-Tunnel und DNS/CDN-Diensten.
3 Jahre 9 Monate
2019-04 - 2022-12
Operations Teamlead, ATU
DevOps Engineer, Operations Teamlead
DevOps Engineer, Operations Teamlead
Bereitstellung umfassender Unterstützung bei der Wartung einer Hybrid-Cloud-Infrastruktur über einen Zeitraum von über vier Jahren, um einen reibungslosen Openshift Betrieb und optimale Leistung sicherzustellen
Diagnostizierung und Lösung von Problemen im Zusammenhang mit der Einrichtung des Active Directory Distributed File System (DFS)-Roamingprofils für den Lastausgleich unter Verwendung eines Prometheus Exporter für Windows-Maschinen
Integration von Active Directory (AD)-Authentifizierung über Kerberos auf Keycloak, um Single Sign-On (SSO) für verschiedene Dienste zu ermöglichen
Erleichterung der Migration und Verwaltung einer SPNEGO-basierten AD Single Sign-On (SSO)-Lösung auf NGINX-Endpunkten, um sichere und effiziente Authentifizierungsmechanismen zu gewährleisten.
Implementierung von ISO27001 Maßnahmen, insbesondere im Zusammenhang mit Container-Security, Rechenzentrum und Netzwerk Best Practices
Implementierung eines Ceph/Rook-Storage-Clusters auf Basis von Kubernetes sowie das Bereitstellen verschiedener Speichersysteme wie Block Storage, S3 und CephFS sowie die Wartung des Clusters mit ArgoCD und Ansible.
Nutzung von OpenStack Cinder zur Verwaltung von Block-Storage-Lösungen in Verbindung mit Ceph.
Optimierung und Automatisierung von OpenStack Nova für das Management von virtuellen Maschinen in einer Hybrid-Cloud-Umgebung.
Entwicklung von Automatisierungs- und Verwaltungstools mit Golang zur Optimierung von Kubernetes- und OpenStack-Workflows, insbesondere für Skalierungsmechanismen und Self-Healing-Prozesse
Einsatz von Crossplane zur Verwaltung und Provisionierung von Cloud-Ressourcen über verschiedene Umgebungen hinweg, um eine einheitliche, deklarative Infrastruktur für Kubernetes-basierte Workloads zu ermöglichen
Architektur und Aufbau einer Logging und Monitoring Lösung mittels Elasticsearch/Grafana/Prometheus/Fluentd
Architektur und Aufbau eines SOC und SIEM Architektur mittels Datadog samt Logging, Alerting und Monitoring von Anomalien und verdächtigen Netzwerk-Aktivitäten
1 Jahr
2020-04 - 2021-03
Security Engineer, HelloFresh
Security Engineer
Security Engineer
Implementierung und Verwaltung der CloudFlare Web Application Firewall (WAF) zur proaktiven Bedrohungsabwehr und Reaktion auf Vorfälle, sowie des auf AWS bereitgestellten ELK-Stacks (Elasticsearch, Logstash, Kibana) für umfassende Protokollanalyse und -überwachung
Überprüfung der Sicherheitsmaßnahmen gemäß BSI bzw. ISO 27001, insbesondere im Bereich der Container-Sicherheit, Identifizierung von Schwachstellen sowie Durchführung von Sicherheitsscans sowohl offline als auch online für Deployments.
Betrieb von Kubernetes und Openshift Instanzen für unterschiedliche Umgebungen
7 Monate
2019-06 - 2019-12
DevOps Team Lead, UMI Urban Mobility International GmbH
DevOps Team Lead
DevOps Team Lead
Unterstützung bei der Organisation während der Go-Live-Phase des Produkts und Sicherstellung der Betriebsbereitschaft der Infrastruktur um eine nahtlose Bereitstellung zu gewährleisten.
Implementierung und Wartung von OpenStack Nova zur Verwaltung von Cloud-Instanzen in einer skalierbaren Umgebung.
Integration von OpenStack Cinder zur effizienten Verwaltung von Speichervolumen für kritische Anwendungen.
Implementierung eines kennzahlbasierten Prozesses zur Bewertung der Produktqualität aus der Sicht des Endbenutzers, wodurch Ziele und Schlüsselergebnisse (OKRs) beeinflusst wurden.
Leitete die Aktivitäten eines Teams von 5 Site Reliability Engineers (SREs), überwachte deren Aufgaben und stellte die Ausrichtung auf die Unternehmensziele sicher.
1 Jahr 7 Monate
2017-11 - 2019-05
CTO, SiWeGO
CTO
CTO
Implementierung der CloudFlare Web Application Firewall (WAF) und Verwaltung von Incident Response-Verfahren sowie ELK-Stack-Bereitstellung auf AWS für eine umfassende Protokollanalyse.
Verwaltung von Lieferantenbeziehungen und Lieferantenpartnerschaften, um einen reibungslosen Betrieb und eine pünktliche Bereitstellung von Dienstleistungen sicherzustellen.
Entwicklung von Lösungen mit Fokus auf die Minimierung der Betriebsausgaben (OPEX) bei gleichbleibender hoher Leistung und Zuverlässigkeit.
Entwicklung algorithmischer Ansätze für die Gestaltung von Diagrammüberlappungen, um eine effiziente Indizierung und Abfrage von Daten sicherzustellen.
5 Monate
2018-10 - 2019-02
DevOps Engineer, ATU
DevOps Engineer
DevOps Engineer
Implementierung von Kubernetes mit Helm, ELK-Stack und Grafana/Prometheus unter Verwendung von Docker auf VMWARE/Xen-virtualisierten Systemen.
Verwaltung des Content Delivery Networks (CDN) zur Abwehr von Distributed Denial of Service (DDoS) und DNS-Management mit Schwerpunkt der Reduzierung der Angriffsfläche.
Durchführung einer Anwendungsleistungsüberwachung und Bewertung der gesamten Infrastrukturleistung zur Optimierung der Systemeffizienz.
Betriebsunterstützung von Openshift mittels Ansible Playbooks
Unterstützung von ETL-Prozessen (Extract, Transform, Load), um eine nahtlose Datenintegration und -verarbeitung sicherzustellen.
1 Jahr 11 Monate
2016-10 - 2018-08
Sr. Performance Engineer, OLX
Sr.Performance Engineer
Sr.Performance Engineer
Durchführung gründlicher Bewertungs und Auswahlprozesse für Anbieter von Content Delivery Network (CDN), Secure Sockets Layer (SSL) und Domain Name System (DNS) und Bereitstellung interner Schulungen und Beratung zu verwandten Themen innerhalb von OLX
Leitung von Last- und Leistungstestinitiativen und Überprüfung des architektonischen Leistungsdesigns, um die Systemeffizienz und -zuverlässigkeit zu optimieren
Entwicklung umfassender Kapazitätsplanungsstrategien für die Migration von Bare-Metal-Infrastrukturen zu Cloud-basierten Lösungen, um einen nahtlosen Übergang und Skalierbarkeit sicherzustellen
Entwicklung von leistungsoptimierten Tools und Automatisierungslösungen mit Golang zur Analyse und Verbesserung von Systemperformance und Netzwerkkommunikation
Entwicklung und Weiterpflegen der Linux-Server Landschaft mittels Ansible inklusiv Patch-Management und Implementierung von neuen Security-Anforderungen
Bereitstellung von Coaching und Unterstützung für über 50 Ingenieure im gesamten Unternehmen, Förderung der Kompetenzentwicklung und des Wissensaustauschs, um kontinuierliche Verbesserungen voranzutreiben
2 Jahre 11 Monate
2013-11 - 2016-09
Service Reliability Engineer, SonyPlaystation (?Playstation Now? service - GAIKAI)
Service Reliability Engineer
Service Reliability Engineer
Entwurf und Implementierung einer robusten Network Time Protocol (NTP)-Infrastruktur, um eine präzise Zeitsynchronisierung zwischen Systemen sicherzustellen
Verwaltung der Paketwartung von KVM/Ganeti Gentoo und Sicherstellung der Stabilität und Zuverlässigkeit der Virtualisierungsumgebung
Fachexperte für Hadoop und strategische Beratung, sowie technische Führung bei der Implementierung und Optimierung von Hadoop-basierten Lösungen
Entwicklung von CEPH-Speicherlösungen zur Bereitstellung einer skalierbaren, leistungsstarken Speicherinfrastruktur, die auf die Anforderungen des Unternehmens zugeschnitten ist.
Erhielt im ersten Quartal 2016 in New York City offizielles RH-Training "Red Hat Ceph Storage Architecture and Administration (CEPH125)" von J. C. Lopez.
Entwicklung von NFS-Speichersystemen zur Erzielung optimaler Leistung mit einem Durchsatz von 40 Mbit/s pro Client und einem Zielausgang von 46 Gbit/s von einem einzelnen Knoten, der das Rack bedient
Entwicklung einer domänenspezifischen Sprache (DSL) unter Verwendung der textX-Bibliothek für erweiterte Funktionalität und Flexibilität bei der Abfrage der Graphite-API
Bereitstellung umfassender Coaching- und Schulungsmaßnahmen für neue Mitarbeiter (5), um deren Integration in das Team zu erleichtern und die Kompetenz in ihren Rollen sicherzustellen
Einführung von Ansible als zentrale Konfigurationsmanagement-Tool für alle Linux-Server OnPrem
10 Monate
2012-10 - 2013-07
Sr.Data Architect, Rocket Internet
Sr.Software Engineer
Sr.Software Engineer
Agierte als System Operations (Sysop) und Entwickler für das Business Intelligence-Team und überwachte die kritische Infrastruktur und Softwareentwicklung.
Entwicklung und Implementierung eines Python-basierten FLASK Google Analytics API-Abrufers zum Sammeln und Verarbeiten von Daten für Analysezwecke.
Installierung, Konfiguration und Verwaltung eines Hadoop/MapR M3-Cluster bestehend aus 5 Knoten, der die Verarbeitung und Analyse großer Datenmengen erleichtert.
Integration von HIVE und SquirrelSQL über Thrift2/JDBC, um eine nahtlose Interaktion mit dem Hadoop-Ökosystem zu ermöglichen und um Datenwissenschaftlern effiziente Einblicke zu eröffnen.
Pionierarbeit für verschiedene Datenaufnahmepfade, die für Szenarien mit großer Entfernung und hoher Latenz optimiert sind und eine robuste Datenerfassung in verschiedenen Umgebungen gewährleisten.
Bereitstellung fachmännischer Unterstützung für das Team bei der Ausführung von ETL-Geschäftsprozessen (Extract, Transform, Load) und Optimierung von Daten-Workflows für mehr Effizienz und Genauigkeit.
1 Jahr 2 Monate
2011-07 - 2012-08
Backend QA Manager, ?txtr
Backend QA Manager
Backend QA Manager
Initiierung der Entwicklung von eBook-Lesetechnologie, spezialisiert auf Adobe DRM-bezogene Technologien
Durchführung von REST-API-Benutzerakzeptanz- und Last- und Leistungstests
Leitung von Notfall- und Ursachenanalysemaßnahmen bei kritischen Vorfällen
Implementierung von Betriebsüberwachungsstrategien, um die Systemstabilität und -leistung sicherzustellen
Versiert in der Programmierung mit Python, Ruby, C++ und Java
Entwicklung einer Ruby-basierten Testautomatisierungslösung unter Verwendung der Cucumber- und Selenium-Frameworks
Entwicklung einer XML-, XPATH- und XQUERY-Suchmaschine für effiziente Datenabfrage
Leitung einer Proof-of-Concept-Initiative mit Hadoop-Technologie
Durchführung von CDN- und RUM-Tests unter Nutzung JMX-basierter instrumentierter Metriken zur Leistungsbewertung
Durchführung von Code-Reviews zur Sicherstellung von Codequalität und Einhaltung bewährter Verfahren
Überwachung der Berichts- und Koordinierungsaktivitäten für ein Team von drei UAT-Ingenieuren
3 Monate
2011-04 - 2011-06
Sr.System Engineer, ProfiBricks
Sr.System Engineer
Sr.System Engineer
Implementierung einer Debian-basierten KVM-Private-Cloud-Lösung
Stellvertretender Leiter des Betriebsteams und Beaufsichtigung eines Teams von 6 Ingenieuren
Durchführung von Softwarepaketierungsaktivitäten
Python-Skripterstellung und Arbeit mit Konfigurationsmanagement-Tools wie bcfg2 und Puppet
Effektive Verwaltung von Überwachungs- und Sicherungsvorgängen
7 Monate
2010-10 - 2011-04
Sr.System Engineer, Nokia
Sr.System Engineer
Sr.System Engineer
Unterstützung von 7 verschiedenen Teams im Zusammenhang mit Nokia Maps / NAVTEQ in einer DevOps-Funktion
Einrichtung kontinuierlicher Integrationsprozesse
Paketierung für REDHAT/CentOS-Systeme
Skripterstellung in Python und Ruby und Nutzung von Konfigurationsmanagement-Tools wie Puppet bzw. Ansible
Abwicklung von Vorgängen im Zusammenhang mit Entwicklungs-Rechenzentren.
2 Jahre 6 Monate
2008-04 - 2010-09
Consultant ? Sr.Test Specialist, Vodafone
Consultant ? Sr.Tst Specialist
Consultant ? Sr.Tst Specialist
Sicherer Umgang mit Leistungstesttools wie Grinder, Apache Bench und JMeter
Erfahrung in der Implementierung von Testautomatisierungsmethoden.
Spielte eine Schlüsselrolle bei der erfolgreichen Umsetzung großer Projekte, darunter:
Vodafone Live! (J2EE basierte web mobile platform)
Vodafone 360 (Projekt mit einem geschätzten Budget von ca. 250 Millionen Euro)
Vodafone GIG (Tibco-basierte SOA-Infrastruktur)
Nachgewiesene Führungsqualitäten als Fachexperte, Koordinierung der Testaktivitäten innerhalb eines Teams von 10 QA-Ingenieuren
Kompetenzen
Kompetenzen
Produkte / Standards / Erfahrungen / Methoden
MSDos
win31
XP
10
11
NT
Kerberos
LDAP
CDN Management
SSL
DNS Infrastructure Design
OpenID Connect (OIDC)
F5 BigIP
Traefik
GSM
Over the Air
Akamai
Cloudflare
Tunnels
DNS
TCP/IP
PXE/TFTP
AWS
NLB
ALB
ELB
Apache
Juniper
ARP
Azore Storage technologies
MinIO
Kubernetes Storage (CSI)
Hadoop, CEPH
NFS Storage Design
Hadoop DFS
GlusterFS
AndrewFS
Mixrosoft DFS/Samba
NFS
iSCSI
ELK Stack
Grafana
Prometheus.io
Datadog
Nagios
Nagiosgrapher
SumoLogic
WAF
SSO
Bot detection
Datadome
Azure AD (Entra ID)
SAML
x509
GitOps
Kubernetes
Rancher
GitLab CI/CD
Docker
VMware/Xen Virtualized Systems
Mobile Load
Testing
Continuous Integration Setup
AWS EKS
EC2
VPC
S3
Cloud Native Architecture Design
Hybrid Cloud
Helm
GitOp
NginX
Vault
Sealed secrets
CoreDNS
MongoDB
MySQL
Oracle
PostgreSQL
Redis
Hbase
Hive
eXist
XPath
CouchBase
memcached
Agile
Scrum
ESX
KVM/Ganeti
Terraform
Pulumi
Ansible
Puppet
Bfcg2
Chef
CFEngine
Salt
Debian-Based Private Cloud Solution
Linux Administration
Red Hat/CentOS Packaging
Ubuntu
Debian
Fedora
Programmiersprachen
C
PHP
Python
Ruby
SQL
Java
Jython
C++
XML
XSLT
EJB
Go
Erlang
Perl
Einsatzorte
Einsatzorte
Deutschland
möglich
Projekte
Projekte
1 Jahr 4 Monate
2024-01 - heute
DevOps Teamlead, Octostar LTD
DevOps Teamlead
DevOps Teamlead
Einführung, Aufbau und Schulung im Bereich Kubernetes EKS sowie deren relenaten Tools wie Kubernetes UI, k9, stern und LENS zum Debuggen von Anwendungen
Architektur und Aufbau eines Data Analytics Plattforms basierend auf Apache-Superset, Clickhouse, kind-kubernetes und GPU / CUDA Machine Learning aud AWS und auf Hetzner.
Streamlined deliverable of an Intelligence DATA ANALYTICS solution based on apache-superset, clickhouse, kind-kubernetes, GPU / CUDA Machine Learning on AWS and Hetzner premises.
Einführung von Infrastructure as Code (Iac) für alle neu und bestehende Infrastruktur mittels Ansible, Terraform, ArgoCD und Kubernetes Operatoren
Einsatz von Cilium als CNI (Container Network Interface) in Kubernetes-Clustern zur Optimierung der Netzwerksicherheit, Observability und Performance durch eBPF-basierte Netzwerk- und Sicherheitsrichtlinien
1 Jahr 4 Monate
2024-01 - heute
DevOps TeamLead, Contensi Software GmbH
DevOps TeamLead
DevOps TeamLead
Betreuung und Anleitung von zwei Junior DevOps-Kollegen. Förderung der beruflichen Entwicklung und Fähigkeiten des Teams.
Leitung des Aufbaus eines Referenz-MinIO-Speicherclusters unter Verwendung von Rancher Kubernetes, um Robustheit und Skalierbarkeit für die Speicherinfrastruktur zu gewährleisten.
Extended changes to the Infoblox DNS system, review-ed and fixed the zones propagation
Maintainer von Ganeti (KVM Virtualisierung) Packet bei Gentoo
Contensi Software GmbH
2 Jahre 3 Monate
2023-02 - heute
Site Reliability & Security Engineer, Max Planck Institute
Site Reliability & Security Engineer
Site Reliability & Security Engineer
Implementierung von CI/CD-Pipelines mithilfe von GitLab für lokale und cloudbasierte Umgebungen, einschließlich AWS- und OpenStack-VMs, mit Orchestrierung durch Rancher
Verwaltung und Optimierung von OpenStack Nova für die Bereitstellung und Verwaltung von virtuellen Maschinen.
Nutzung von OpenStack Cinder zur Speicherverwaltung für persistente Volumes innerhalb der OpenStack-Umgebung.
Leitung des Prototypings eines verteilten Speichersystems unter Nutzung von MinIO sowie der Integration von JuiceFS für erweiterte Dateisystemfunktionen sowie die Integration mit Azure AD
Einführung von PortainerIO, um Abläufe zu rationalisieren und eine benutzerfreundliche Verwaltung für ein Team von technisch nicht versierten Benutzern zu erleichtern
Einführung von Dynatrace als einheitliche Logging/Monitoring System für OnPrem und Cloud Resourcen
Aufbau eines SIEM/SOC mittels Newrelic
Implementierung von OpenTelemetry für verteiltes Tracing und Metrik-Erfassung zur Optimierung der Systemtransparenz und Performance-Überwachung
Einsatz von Cilium als CNI für Rancher Kubernetes Cluster zur Optimierung der Netzwerksicherheit und Performance durch eBPF-basierte Netzwerk- und Sicherheitsrichtlinien
Aufbau der gesamten Infrastruktur as Code mittels Terraform CDK, Ansible und Kubernetes Operatoren
Erweiterte Änderungen am Infoblox-DNS-System, Überarbeitung und Korrektur der Zonenverschiebung
Max Planck Institute
5 Monate
2023-07 - 2023-11
Site Reliability & Security Engineer,Skycharge
Site Reliability & Security Engineer
Site Reliability & Security Engineer
Entwicklung einer Debian-Paketerweiterung für eine ANSI-C-Codebasis, optimiert für die Armh-Architektur (BeagleBoard) um Funktionalität und Kompatibilität zu verbessern.
Leitung der Einführung von Unit-Tests neben der Nutzung von GDB zur umfassenden Code-Validierung und Qualitätssicherung.
Skycharge
9 Monate
2022-11 - 2023-07
Security Engineer Team Lead, Prima Assicurazioni
Site Reliability & Security Engineer
Site Reliability & Security Engineer
Unterstützung von organisatorischen Umstrukturierungen als Wegbereiter für Veränderungen und geschickter Verhandlungsführer. Resultierend in nahtlose Übergange von Prozessen und einer verbesserten betrieblichen Effizienz.
Behebung von Reibungspunkten und Unterstützung der Karriereerwartungen für ein Team von 12 Site Reliability Engineers (SREs) sowie weiteren 28 Fachleuten im gesamten Unternehmen.
Durchführung umfassender Überprüfungen von Data Warehouse-Prozessen und -Designs, wobei diese an den Prinzipien des Domain Driven Design ausgerichtet wurden, um Funktionalität und Skalierbarkeit zu optimieren.
Migration von Pulumi als Infrastructure as Code (IaC) zu Terraform sowie die Einführung vom Ansible für Konfigurationsmanagement
Implementierung von OpenTelemetry zur verbesserten Überwachung und Nachverfolgbarkeit von Systemmetriken und verteilten Traces innerhalb der Sicherheitsinfrastruktur
Identifizierung von Stakeholdern und Durchführung von gründlichen Überprüfungen der Geschäftsprozesse zur Sicherstellung der DSGVO-Vorschriften, wobei Datenschutz- und Sicherheitsmaßnahmen Vorrang hatten.
Prima Assicurazioni
9 Monate
2022-11 - 2023-07
Site Reliability Team-Lead,ClovrLabs
Site Reliability Team-Lead, Site Reliability & Security Engineer
Site Reliability Team-Lead, Site Reliability & Security Engineer
Fungieren als entscheidende Schlüsselfigur bei der Architektur einer Cloud-Native-Infrastruktur innerhalb einer Hybrid-Cloud-Umgebung und leitete gleichzeitig die Rekrutierung und nahtlose Einarbeitung eines kompetenten Teams von Vollzeitmitarbeitern (FTEs).
Bereitstellung fachkundiger Beratung zu Best Practices für die Cloud-Architektur bei einem renommierten Unternehmen für Blockchain-Reputation, um eine Ausrichtung an branchenüblichen Standards und optimale Leistung sicherzustellen.
Aufbau und Pflege eines robusten und skalierbaren AWS EKS (Kubernetes)-Setups, welches sich durch Effizienz, Sauberkeit und einfache Wartung auszeichnete.
Entwicklung von Lösungen zur Migration von VMware-basierten VMs auf -basierte Instanzen.
Implementierung von als Speicherlösung für containerisierte Workloads und persistente Speicherschichten.
Durchführung von Echtzeit-Codeprofilen und Durchführung umfassender Last- und Leistungstests zur Optimierung der Systemleistung und Verbesserung der Zuverlässigkeit.
Bewertung der Dimensionierung der lokalen Infrastruktur, um eine optimale Ressourcenzuteilung und Effizienz sicherzustellen.
Entwurf und Inbetriebnahme einer ETL-Lösung (Extract, Transform, Load) mit Jupyter Notebooks und Spark, die eine effiziente Datenverarbeitung und -analyse ermöglicht.
Führung und Mentoring für ein Team von sechs DevOps/SRE-Fachleuten im gesamten Unternehmen, Förderung der Zusammenarbeit und Förderung der operativen Exzellenz
Aufbau und Architektur eines verteilten Zero-Trust-Setups basierend auf Cloudflare-Tunnel und DNS/CDN-Diensten.
3 Jahre 9 Monate
2019-04 - 2022-12
Operations Teamlead, ATU
DevOps Engineer, Operations Teamlead
DevOps Engineer, Operations Teamlead
Bereitstellung umfassender Unterstützung bei der Wartung einer Hybrid-Cloud-Infrastruktur über einen Zeitraum von über vier Jahren, um einen reibungslosen Openshift Betrieb und optimale Leistung sicherzustellen
Diagnostizierung und Lösung von Problemen im Zusammenhang mit der Einrichtung des Active Directory Distributed File System (DFS)-Roamingprofils für den Lastausgleich unter Verwendung eines Prometheus Exporter für Windows-Maschinen
Integration von Active Directory (AD)-Authentifizierung über Kerberos auf Keycloak, um Single Sign-On (SSO) für verschiedene Dienste zu ermöglichen
Erleichterung der Migration und Verwaltung einer SPNEGO-basierten AD Single Sign-On (SSO)-Lösung auf NGINX-Endpunkten, um sichere und effiziente Authentifizierungsmechanismen zu gewährleisten.
Implementierung von ISO27001 Maßnahmen, insbesondere im Zusammenhang mit Container-Security, Rechenzentrum und Netzwerk Best Practices
Implementierung eines Ceph/Rook-Storage-Clusters auf Basis von Kubernetes sowie das Bereitstellen verschiedener Speichersysteme wie Block Storage, S3 und CephFS sowie die Wartung des Clusters mit ArgoCD und Ansible.
Nutzung von OpenStack Cinder zur Verwaltung von Block-Storage-Lösungen in Verbindung mit Ceph.
Optimierung und Automatisierung von OpenStack Nova für das Management von virtuellen Maschinen in einer Hybrid-Cloud-Umgebung.
Entwicklung von Automatisierungs- und Verwaltungstools mit Golang zur Optimierung von Kubernetes- und OpenStack-Workflows, insbesondere für Skalierungsmechanismen und Self-Healing-Prozesse
Einsatz von Crossplane zur Verwaltung und Provisionierung von Cloud-Ressourcen über verschiedene Umgebungen hinweg, um eine einheitliche, deklarative Infrastruktur für Kubernetes-basierte Workloads zu ermöglichen
Architektur und Aufbau einer Logging und Monitoring Lösung mittels Elasticsearch/Grafana/Prometheus/Fluentd
Architektur und Aufbau eines SOC und SIEM Architektur mittels Datadog samt Logging, Alerting und Monitoring von Anomalien und verdächtigen Netzwerk-Aktivitäten
1 Jahr
2020-04 - 2021-03
Security Engineer, HelloFresh
Security Engineer
Security Engineer
Implementierung und Verwaltung der CloudFlare Web Application Firewall (WAF) zur proaktiven Bedrohungsabwehr und Reaktion auf Vorfälle, sowie des auf AWS bereitgestellten ELK-Stacks (Elasticsearch, Logstash, Kibana) für umfassende Protokollanalyse und -überwachung
Überprüfung der Sicherheitsmaßnahmen gemäß BSI bzw. ISO 27001, insbesondere im Bereich der Container-Sicherheit, Identifizierung von Schwachstellen sowie Durchführung von Sicherheitsscans sowohl offline als auch online für Deployments.
Betrieb von Kubernetes und Openshift Instanzen für unterschiedliche Umgebungen
7 Monate
2019-06 - 2019-12
DevOps Team Lead, UMI Urban Mobility International GmbH
DevOps Team Lead
DevOps Team Lead
Unterstützung bei der Organisation während der Go-Live-Phase des Produkts und Sicherstellung der Betriebsbereitschaft der Infrastruktur um eine nahtlose Bereitstellung zu gewährleisten.
Implementierung und Wartung von OpenStack Nova zur Verwaltung von Cloud-Instanzen in einer skalierbaren Umgebung.
Integration von OpenStack Cinder zur effizienten Verwaltung von Speichervolumen für kritische Anwendungen.
Implementierung eines kennzahlbasierten Prozesses zur Bewertung der Produktqualität aus der Sicht des Endbenutzers, wodurch Ziele und Schlüsselergebnisse (OKRs) beeinflusst wurden.
Leitete die Aktivitäten eines Teams von 5 Site Reliability Engineers (SREs), überwachte deren Aufgaben und stellte die Ausrichtung auf die Unternehmensziele sicher.
1 Jahr 7 Monate
2017-11 - 2019-05
CTO, SiWeGO
CTO
CTO
Implementierung der CloudFlare Web Application Firewall (WAF) und Verwaltung von Incident Response-Verfahren sowie ELK-Stack-Bereitstellung auf AWS für eine umfassende Protokollanalyse.
Verwaltung von Lieferantenbeziehungen und Lieferantenpartnerschaften, um einen reibungslosen Betrieb und eine pünktliche Bereitstellung von Dienstleistungen sicherzustellen.
Entwicklung von Lösungen mit Fokus auf die Minimierung der Betriebsausgaben (OPEX) bei gleichbleibender hoher Leistung und Zuverlässigkeit.
Entwicklung algorithmischer Ansätze für die Gestaltung von Diagrammüberlappungen, um eine effiziente Indizierung und Abfrage von Daten sicherzustellen.
5 Monate
2018-10 - 2019-02
DevOps Engineer, ATU
DevOps Engineer
DevOps Engineer
Implementierung von Kubernetes mit Helm, ELK-Stack und Grafana/Prometheus unter Verwendung von Docker auf VMWARE/Xen-virtualisierten Systemen.
Verwaltung des Content Delivery Networks (CDN) zur Abwehr von Distributed Denial of Service (DDoS) und DNS-Management mit Schwerpunkt der Reduzierung der Angriffsfläche.
Durchführung einer Anwendungsleistungsüberwachung und Bewertung der gesamten Infrastrukturleistung zur Optimierung der Systemeffizienz.
Betriebsunterstützung von Openshift mittels Ansible Playbooks
Unterstützung von ETL-Prozessen (Extract, Transform, Load), um eine nahtlose Datenintegration und -verarbeitung sicherzustellen.
1 Jahr 11 Monate
2016-10 - 2018-08
Sr. Performance Engineer, OLX
Sr.Performance Engineer
Sr.Performance Engineer
Durchführung gründlicher Bewertungs und Auswahlprozesse für Anbieter von Content Delivery Network (CDN), Secure Sockets Layer (SSL) und Domain Name System (DNS) und Bereitstellung interner Schulungen und Beratung zu verwandten Themen innerhalb von OLX
Leitung von Last- und Leistungstestinitiativen und Überprüfung des architektonischen Leistungsdesigns, um die Systemeffizienz und -zuverlässigkeit zu optimieren
Entwicklung umfassender Kapazitätsplanungsstrategien für die Migration von Bare-Metal-Infrastrukturen zu Cloud-basierten Lösungen, um einen nahtlosen Übergang und Skalierbarkeit sicherzustellen
Entwicklung von leistungsoptimierten Tools und Automatisierungslösungen mit Golang zur Analyse und Verbesserung von Systemperformance und Netzwerkkommunikation
Entwicklung und Weiterpflegen der Linux-Server Landschaft mittels Ansible inklusiv Patch-Management und Implementierung von neuen Security-Anforderungen
Bereitstellung von Coaching und Unterstützung für über 50 Ingenieure im gesamten Unternehmen, Förderung der Kompetenzentwicklung und des Wissensaustauschs, um kontinuierliche Verbesserungen voranzutreiben
2 Jahre 11 Monate
2013-11 - 2016-09
Service Reliability Engineer, SonyPlaystation (?Playstation Now? service - GAIKAI)
Service Reliability Engineer
Service Reliability Engineer
Entwurf und Implementierung einer robusten Network Time Protocol (NTP)-Infrastruktur, um eine präzise Zeitsynchronisierung zwischen Systemen sicherzustellen
Verwaltung der Paketwartung von KVM/Ganeti Gentoo und Sicherstellung der Stabilität und Zuverlässigkeit der Virtualisierungsumgebung
Fachexperte für Hadoop und strategische Beratung, sowie technische Führung bei der Implementierung und Optimierung von Hadoop-basierten Lösungen
Entwicklung von CEPH-Speicherlösungen zur Bereitstellung einer skalierbaren, leistungsstarken Speicherinfrastruktur, die auf die Anforderungen des Unternehmens zugeschnitten ist.
Erhielt im ersten Quartal 2016 in New York City offizielles RH-Training "Red Hat Ceph Storage Architecture and Administration (CEPH125)" von J. C. Lopez.
Entwicklung von NFS-Speichersystemen zur Erzielung optimaler Leistung mit einem Durchsatz von 40 Mbit/s pro Client und einem Zielausgang von 46 Gbit/s von einem einzelnen Knoten, der das Rack bedient
Entwicklung einer domänenspezifischen Sprache (DSL) unter Verwendung der textX-Bibliothek für erweiterte Funktionalität und Flexibilität bei der Abfrage der Graphite-API
Bereitstellung umfassender Coaching- und Schulungsmaßnahmen für neue Mitarbeiter (5), um deren Integration in das Team zu erleichtern und die Kompetenz in ihren Rollen sicherzustellen
Einführung von Ansible als zentrale Konfigurationsmanagement-Tool für alle Linux-Server OnPrem
10 Monate
2012-10 - 2013-07
Sr.Data Architect, Rocket Internet
Sr.Software Engineer
Sr.Software Engineer
Agierte als System Operations (Sysop) und Entwickler für das Business Intelligence-Team und überwachte die kritische Infrastruktur und Softwareentwicklung.
Entwicklung und Implementierung eines Python-basierten FLASK Google Analytics API-Abrufers zum Sammeln und Verarbeiten von Daten für Analysezwecke.
Installierung, Konfiguration und Verwaltung eines Hadoop/MapR M3-Cluster bestehend aus 5 Knoten, der die Verarbeitung und Analyse großer Datenmengen erleichtert.
Integration von HIVE und SquirrelSQL über Thrift2/JDBC, um eine nahtlose Interaktion mit dem Hadoop-Ökosystem zu ermöglichen und um Datenwissenschaftlern effiziente Einblicke zu eröffnen.
Pionierarbeit für verschiedene Datenaufnahmepfade, die für Szenarien mit großer Entfernung und hoher Latenz optimiert sind und eine robuste Datenerfassung in verschiedenen Umgebungen gewährleisten.
Bereitstellung fachmännischer Unterstützung für das Team bei der Ausführung von ETL-Geschäftsprozessen (Extract, Transform, Load) und Optimierung von Daten-Workflows für mehr Effizienz und Genauigkeit.
1 Jahr 2 Monate
2011-07 - 2012-08
Backend QA Manager, ?txtr
Backend QA Manager
Backend QA Manager
Initiierung der Entwicklung von eBook-Lesetechnologie, spezialisiert auf Adobe DRM-bezogene Technologien
Durchführung von REST-API-Benutzerakzeptanz- und Last- und Leistungstests
Leitung von Notfall- und Ursachenanalysemaßnahmen bei kritischen Vorfällen
Implementierung von Betriebsüberwachungsstrategien, um die Systemstabilität und -leistung sicherzustellen
Versiert in der Programmierung mit Python, Ruby, C++ und Java
Entwicklung einer Ruby-basierten Testautomatisierungslösung unter Verwendung der Cucumber- und Selenium-Frameworks
Entwicklung einer XML-, XPATH- und XQUERY-Suchmaschine für effiziente Datenabfrage
Leitung einer Proof-of-Concept-Initiative mit Hadoop-Technologie
Durchführung von CDN- und RUM-Tests unter Nutzung JMX-basierter instrumentierter Metriken zur Leistungsbewertung
Durchführung von Code-Reviews zur Sicherstellung von Codequalität und Einhaltung bewährter Verfahren
Überwachung der Berichts- und Koordinierungsaktivitäten für ein Team von drei UAT-Ingenieuren
3 Monate
2011-04 - 2011-06
Sr.System Engineer, ProfiBricks
Sr.System Engineer
Sr.System Engineer
Implementierung einer Debian-basierten KVM-Private-Cloud-Lösung
Stellvertretender Leiter des Betriebsteams und Beaufsichtigung eines Teams von 6 Ingenieuren
Durchführung von Softwarepaketierungsaktivitäten
Python-Skripterstellung und Arbeit mit Konfigurationsmanagement-Tools wie bcfg2 und Puppet
Effektive Verwaltung von Überwachungs- und Sicherungsvorgängen
7 Monate
2010-10 - 2011-04
Sr.System Engineer, Nokia
Sr.System Engineer
Sr.System Engineer
Unterstützung von 7 verschiedenen Teams im Zusammenhang mit Nokia Maps / NAVTEQ in einer DevOps-Funktion
Einrichtung kontinuierlicher Integrationsprozesse
Paketierung für REDHAT/CentOS-Systeme
Skripterstellung in Python und Ruby und Nutzung von Konfigurationsmanagement-Tools wie Puppet bzw. Ansible
Abwicklung von Vorgängen im Zusammenhang mit Entwicklungs-Rechenzentren.
2 Jahre 6 Monate
2008-04 - 2010-09
Consultant ? Sr.Test Specialist, Vodafone
Consultant ? Sr.Tst Specialist
Consultant ? Sr.Tst Specialist
Sicherer Umgang mit Leistungstesttools wie Grinder, Apache Bench und JMeter
Erfahrung in der Implementierung von Testautomatisierungsmethoden.
Spielte eine Schlüsselrolle bei der erfolgreichen Umsetzung großer Projekte, darunter:
Vodafone Live! (J2EE basierte web mobile platform)
Vodafone 360 (Projekt mit einem geschätzten Budget von ca. 250 Millionen Euro)
Vodafone GIG (Tibco-basierte SOA-Infrastruktur)
Nachgewiesene Führungsqualitäten als Fachexperte, Koordinierung der Testaktivitäten innerhalb eines Teams von 10 QA-Ingenieuren
Kompetenzen
Kompetenzen
Produkte / Standards / Erfahrungen / Methoden
MSDos
win31
XP
10
11
NT
Kerberos
LDAP
CDN Management
SSL
DNS Infrastructure Design
OpenID Connect (OIDC)
F5 BigIP
Traefik
GSM
Over the Air
Akamai
Cloudflare
Tunnels
DNS
TCP/IP
PXE/TFTP
AWS
NLB
ALB
ELB
Apache
Juniper
ARP
Azore Storage technologies
MinIO
Kubernetes Storage (CSI)
Hadoop, CEPH
NFS Storage Design
Hadoop DFS
GlusterFS
AndrewFS
Mixrosoft DFS/Samba
NFS
iSCSI
ELK Stack
Grafana
Prometheus.io
Datadog
Nagios
Nagiosgrapher
SumoLogic
WAF
SSO
Bot detection
Datadome
Azure AD (Entra ID)
SAML
x509
GitOps
Kubernetes
Rancher
GitLab CI/CD
Docker
VMware/Xen Virtualized Systems
Mobile Load
Testing
Continuous Integration Setup
AWS EKS
EC2
VPC
S3
Cloud Native Architecture Design
Hybrid Cloud
Helm
GitOp
NginX
Vault
Sealed secrets
CoreDNS
MongoDB
MySQL
Oracle
PostgreSQL
Redis
Hbase
Hive
eXist
XPath
CouchBase
memcached
Agile
Scrum
ESX
KVM/Ganeti
Terraform
Pulumi
Ansible
Puppet
Bfcg2
Chef
CFEngine
Salt
Debian-Based Private Cloud Solution
Linux Administration
Red Hat/CentOS Packaging
Ubuntu
Debian
Fedora
Programmiersprachen
C
PHP
Python
Ruby
SQL
Java
Jython
C++
XML
XSLT
EJB
Go
Erlang
Perl
Vertrauen Sie auf Randstad
Im Bereich Freelancing
Im Bereich Arbeitnehmerüberlassung / Personalvermittlung