Architektur und Entwicklung einer Data Management Platform (DMP) zur Verarbeitung von Click-Stream Daten und zur User-Segmentierung.
Aufgaben:
Konzeption und Implementierung einer Lambda-Architektur zur skalierbaren Aufnahme von Click-Stream Daten und Erstellung von Audience-Segmenten auf einem Kubernetes Cluster, mit folgenden Schwerpunkten:
- Streaming-Pipeline zur Aufnahme, Transformation, Validierung & Filterung und Persistierung von Click-Stream Daten. (Spring Boot 2, Microservices, Kubernetes, S3, Kafka)
- Spark-basierende Batch-Jobs zur Ermittlung von Cookie-
Labels und Berechnung der Segmente mit verschiedenen Auspr¨agungen und verschiedenen Wahrscheinlichkeiten (Cassandra, Spark, S3, Kafka). - Indizierung der Segmente zur schnellen Berechnung der Kardinalit ¨ at von kombinierten Audience-Segmenten (Spark, ElasticSearch, Spring Boot 2, Cassandra, Kafka).
- Entwicklung und Anpassung verschiedener Helm-Charts für die SB-Microservices und Tech-Infrastruktur (Helm, Kubernetes, Cassandra, ElasticSearch, Kafka, Zookeeper, Prometheus, Grafana).




Veronika, Java Developer