Data Scientist / Data Engineer / Software-Entwickler Machine Learning
Aktualisiert am 14.02.2024
Profil
Mitarbeiter eines Dienstleisters
Remote-Arbeit
Verfügbar ab: 18.02.2024
Verfügbar zu: 95%
davon vor Ort: 95%
Skill-Profil eines fest angestellten Mitarbeiters des Dienstleisters
Deutsch
Muttersprache
Englisch
verhandlungssicher
Französisch
Grundkenntnisse

Einsatzorte

Karlsruhe (Baden) (+300km)
Deutschland, Österreich, Schweiz
möglich

Projekte

5 Monate
2023-09 - heute

AVV Prüfung

Project Lead Python Git Atlassian JIRA ...
Project Lead

Entwicklung eines Systems zur automatisierten Prüfung von Auftragsverarbeitungsverträgen auf Basis von Large Language Models (LLMs).

Aufgaben: Leitung des Projekts und Koordination inklusive der Kundenkommunikations und Erfassung der Anforderungen; Entwurf und Bereitstellung des Services als API innerhalb eines Docker-Containers;
Python Git Atlassian JIRA GitLab CI/CD Docker Azure OpenAI FastAPI Chainlit LLMs
2B Advice
5 Monate
2023-09 - heute

Recommender System für Mitarbeiterprofile

Senior Machine Learning Engineer Python Git GitLab CI/CD ...
Senior Machine Learning Engineer

Entwicklung eines Matching-Algorithmus, der basierend auf einer Projektanfrage passende Mitarbeiterprofile vorschlägt und die bestehende HR Infrastruktur integriert ist.

Aufgaben: Aufbereitung und Indexierung der Mitarbeiterprofile mit Hilfe von Azure Cognitive Search; Konzeption und Entwicklung des Matching Algorithmus; Integration des Algorithmus in die bestehende HR Software.
Python Git GitLab CI/CD Azure OpenAI Azure Cognitive Search Datenanalyse LLMs
AMAI GmbH
3 Monate
2023-07 - 2023-09

Analyse von Gesetzestexten mit KI

Senior Machine Learning Engineer Python SQL Streamlit ...
Senior Machine Learning Engineer

Entwicklung einer Software, die Analysten dabei unterstützt Stellungnahmen zu Gesetzesentwürfen auszuwerten.

Aufgaben: Leitung des Projekts und Koordination; Entwurf der Software-Architektur und des ER-Schemas; Entwicklung der Steamlit-Anwendung; Deployment der Anwendung auf Kubernetes; Textextraktion und -verarbeitung mittels Large Language Modellen.
Python SQL Streamlit Git GitLab CI/CD Docker Kubernetes Poetry Atlassian JIRA Atlassian Confluence Azure LLMs
AMAI GmbH
1 Monat
2023-07 - 2023-07

Voicebot für Hotel-Empfang

Python GitLab CI/CD Docker ...

Entwicklung eines sprachbasierten und telefonisch erreichbaren Systems zur Beantwortung von Fragen für eine Hotel unter Verwendung von Large Language Models (LLMs).

Aufgaben: Entwicklung einer neuartigen Architektur zur Verwendung von Large Language Models in Voicebots. Evaluation und Anbindung verschiedener Streaming-STT und -TTS Dienstleistern im Bezug auf Qualität und Geschwindigkeit. Durchführung von Experimenten zur Verbesserung des User Experience.
Python GitLab CI/CD Docker Poetry Atlassian JIRA Atlassian Confluence Azure Voice Bots Chat Bots ChatGPT OpenAI Elevenlabs Twilio
AMAI GmbH
6 Monate
2023-01 - 2023-06

"Terminfinder" Voicebot

Senior Machine Learning Engineer Python Rasa / Rasa X GitLab CI/CD ...
Senior Machine Learning Engineer

Entwicklung eines sprachbasierten und telefonisch erreichbaren Dialogsystems zur Buchung von Arztterminen.

Aufgaben: Stabilitätsverbesserungen (Analyse und Behebung von Fehlern in der Business-Logik und in den ML-Komponenten, Erweiterung das Testframeworks und Erhöhung der Testabdeckung), welche maßgeblich zur Steigerung der erfolgreichen Buchungen um 15% beigetragen haben. Entwicklung und Vergleich verschiedener Modelle für die Zuordnung von Leistungsbeschreibungen / Symptomen der Nutzer zu angebotenen Leistungen. Durchführung von Experimenten zur Verbesserung der Intentstruktur und dadurch erzielte Verbesserung der Klassifikationsgenauigkeit aller Intents.
Python Rasa / Rasa X GitLab CI/CD Docker Poetry Atlassian JIRA Atlassian Confluence Pydantic Azure Voice Bots Chat Bots Gensim FastText Spacy Duckling chatette PyTorch NLP NLU Transformers
Deutsche Telekom AG
1 Jahr 3 Monate
2021-10 - 2022-12

Aufbau eines neuen SOX Compliance Prozesses

Data Scientist, Product Owner Python SQL
Data Scientist, Product Owner

Im Rahmen der SOX Compliance Prüfung soll ein Monitoring von umsatzrelevanten Prozessen erfolgen. Hierzu werden bestehende Prozesse durch neue Prozesse auf Basis einer internen Zeitreihen- Analyse-Plattform abgelöst. Das Projektteam übernimmt dabei die Verantwortung für den gesamten Prozesslebenszyklus von der Sichtung des bisherigen Standes, Konzeption, Entwicklung bis zum Deployment.

Aufgaben: Konzeption des neuen SOX-Prozesses; Verstehen der bestehenden CDR-Daten innerhalb von einem umsatzrelevanten Abschnitt; Visualisieren der Fehlerfälle; Anpassung und Konfiguration der internen Zeitreihen-Analyse-Plattform; Entwicklung und Implementierung eines Workflows zur Bearbeitung auftretender Fehler; Erstellen unterschiedlicher Visualisierungen, um einen Gesamtüberblick der Prozesse zu ermöglichen.

Tableau Oracle Spark JIRA
Python SQL
Telefonica
2 Jahre
2021-01 - 2022-12

Absatzplanung von Telekommunikationsprodukten

Data Scientist, Softwareentwickler JavaScript TypeScript Java ...
Data Scientist, Softwareentwickler

Neuentwicklung einer Plattform für die einfache Absatzplanung auf Regions-, Bezirks- und Händlerebene.

Aufgaben: Schwächeanalyse der gegenwärtig eingesetzten Anwendung; Analyse und Aufnahme von Anforderungen; Entwurf und Entwicklung der neuen Anwendung.


Spring Boot Docker Angular
JavaScript TypeScript Java HTML
Telefonica
4 Monate
2022-02 - 2022-05

Extraktion von Schlüsselwörtern aus Websiten

Data Scientist networkx scikit-learn Matplotlb ...
Data Scientist

Entwicklung eines Extraktionsalgorithmus von Schlüsselwörtern aus Webseiten, Clustering von Webseiten und Klassifizierung.

Aufgaben: Entwicklung und Implementierung eines Algorithmus für die Bestimmung von Schlagwörtern für Webseiten; Erstellung eines Webseitencrawlers zur Extraktion sichtbaren Textes von Webseiten; Erstellung einer Demo (Frontend, API) für den Algorithmus.

Python JavaScript
networkx scikit-learn Matplotlb Numpy Pandas Jupyter Lab/Notebooks Selenium Scrapy Git Excel
8 Monate
2020-05 - 2020-12

Konsistenzanalyse in Provisionierungsprozessen von Telekommunikationsanwendungen

Data Scientist Python
Data Scientist

Konsistenzanalyse zwischen Komponenten, die am Abrechnungsprozess von Telekommunikationsanwendungen beteiligt sind; Vergleich von Qualitätsattributen (u.a. Surfgeschwindigkeit) von Nutzersessions mit den vertraglich zugesicherten Leistungen.

Aufgaben: Konsistenzanalyse zwischen verschiedenen Haupt- und Subsystemen auf der Grundlage von Oracle-Datenbanken; Entwicklung mehrerer ETL-Prozesse zur kontinuierlichen Fehleranalyse zwischen den Systemen; Ad-hoc-Analyse der Surfgeschwindigkeit von Kunden; Entwicklung eines ETL-Prozesses zur kontinuierlichen Fehleranalyse zur Surfgeschwindigkeit von Kunden.


SQL Oracle Docker PySpark
Python
2 Monate
2020-01 - 2020-02

Web-Service zur Vorhersage von Zolltarifnummern

Data Scientist & Software-Entwickler Natural Language Processing Machine Learning Deep Learning ...
Data Scientist & Software-Entwickler

Konzeption und Implementierung eines Web-Service zur Vorhersage von Zolltarifnummern anhand von Produktbeschreibungen.

? Vergleich von ElasticSearch und Maschinellen Lernverfahren
? Evaluation und Training von Textklassifikationsmodellen
? Flask Server with RESTful API Design

ElasticSearch Scrapy Web Scraping TensorFlow Keras MySQL Docker Jupyter Flask NumPy scikit-learn SciPy Text2Vec Git Microsoft Azure
Natural Language Processing Machine Learning Deep Learning Machine Learning as a Service
[Firmenname auf Anfrage]
2 Monate
2019-12 - 2020-01

Evaluation ML Verfahren für Time Series Analysis

Data Scientist Machine Learning Time Series Analysis Deep Learning
Data Scientist

Komparative Evaluation von statistischen Modellen und von Deep Learning Modellen zur Vorhersage von univariaten und multivariaten Zeitreihen im Rahmen eines Kundenprojektes.

TensorFlow Docker Jupyter Git Microsoft Azure
Machine Learning Time Series Analysis Deep Learning
[Firmenname auf Anfrage]
Karlsruhe
2 Monate
2019-11 - 2019-12

Entwicklung mehrerer ML Web-Demos

Data Scientist & Software-Entwickler Machine Learning Machine Learning as a Service Deep Learning ...
Data Scientist & Software-Entwickler

Veranschaulichung von KI Anwendungsfällen unter [URL auf Anfrage]

• Semantische Suche und Training eines deutschsprachigen Question Answering Modells
• Eigennamenerkennung und Text-Anonymisierung
• Maschinelle Übersetzung (Deutsch/Englisch, Englisch/Deutsch)
• Visuelle Segmentierung via Webcam
• Web-Oberfläche mittels ReactJS
• Cloud-Deployment via Kubernetes auf Microsoft Azure

Python Docker TensorFlow PyTorch Torch TensorFlowJS ReactJS Jupyter Git Microsoft Azure
Machine Learning Machine Learning as a Service Deep Learning Natural Language Processing Natural Language Understanding Computer Vision
[Firmenname auf Anfrage]
Karlsruhe
4 Jahre 10 Monate
2015-01 - 2019-10

Entwicklung eines Recommender Systems für Nutzerprofile

Data Scientist & Software-Entwickler Recommender Systeme Machine Learning
Data Scientist & Software-Entwickler
Scala Apache Mahout
Recommender Systeme Machine Learning
Price Now UG
4 Jahre 10 Monate
2015-01 - 2019-10

Plattform zur automatisierten Überwachung von Webquellen nach Produktrückrufen

Data Scientist & Software-Entwickler Machine Learning
Data Scientist & Software-Entwickler
  • Aufbau einer Plattform zur automatisierten Überwachung von Webquellen nach Produktrückrufen
  • Entwicklung eines Webseiten-Segmentierungsverfahrens
Java JavaScript Spring Boot Weka Google Polymer Selenium Web Scraping
Machine Learning
Datalyxt GmbH
2 Jahre
2013-01 - 2014-12

Anbindung eines SaaS Produktes an diverse Shopsysteme

Software-Entwickler
Software-Entwickler
  • Anbindung eines SaaS Produktes an diverse Shopsysteme
  • Entwicklung einer Administrationsoberfläche für ein E-Mail Marketing Produkt
Scala PHP JavaScript Play Framework Google Polymer
Price Now UG
3 Monate
2012-08 - 2012-10

Ausarbeitung von Analysewerkzeugen für CAD Software Bausteine

Praktikant
Praktikant
Julius Berger International
8 Monate
2001-05 - 2001-12

Konsistenzanalyse in Provisionierungsprozessen von Telekommunikationsanwendungen

Data Scientist Python
Data Scientist

Konsistenzanalyse zwischen Komponenten, die am Abrechnungsprozess von Telekommunikationsanwendungen beteiligt sind; Vergleich von Qualitätsattributen (u.a. Surfgeschwindigkeit) von Nutzersessions mit den vertraglich zugesicherten Leistungen.


Aufgaben: Konsistenzanalyse zwischen verschiedenen Haupt- und Subsystemen auf der Grundlage von Oracle-Datenbanken; Entwicklung mehrerer ETL-Prozesse zur kontinuierlichen Fehleranalyse zwischen den Systemen; Ad-hoc-Analyse der Surfgeschwindigkeit von Kunden; Entwicklung eines ETL-Prozesses zur kontinuierlichen Fehleranalyse zur Surfgeschwindigkeit von Kunden.

SQL Oracle Docker PySpark
Python
[Auf Anfrage]
4 Monate
2001-02 - 2001-05

Extraktion von Schlüsselwörtern aus Websiten

Data Scientist Python JavaScript
Data Scientist

Entwicklung eines Extraktionsalgorithmus von Schlüsselwörtern aus Webseiten, Clustering von Webseiten und Klassifizierung.

Aufgaben: Entwicklung und Implementierung eines Algorithmus für die Bestimmung von Schlagwörtern für Webseiten; Erstellung eines Webseitencrawlers zur Extraktion sichtbaren Textes von Webseiten; Erstellung einer Demo (Frontend, API) für den Algorithmus.


networkx scikit-learn Matplotlb Numpy Pandas Jupyter Lab/Notebooks Selenium Scrapy Git Excel
Python JavaScript
[auf Anfrage]
4 Monate
2001-02 - 2001-05

Extraktion von Schlüsselwörtern aus Webseiten

Data Scientist Python JavaScript
Data Scientist

Entwicklung eines Extraktionsalgorithmus von Schlüsselwörtern aus Webseiten, Clustering von Webseiten und Klassifizierung.

Aufgaben: Entwicklung und Implementierung eines Algorithmus für die Bestimmung von Schlagwörtern für Webseiten; Erstellung eines Webseitencrawlers zur Extraktion sichtbaren Textes von Webseiten; Erstellung einer Demo (Frontend, API) für den Algorithmus.


networkx scikit-learn Matplotlb Numpy Pandas Jupyter Lab/Notebooks Selenium Scrapy Git Excel
Python JavaScript
[Auf Anfrage]
4 Monate
2001-02 - 2001-05

Extraktion von Schlüsselwörtern aus Webseiten

Data Scientist Python JavaScript
Data Scientist

Entwicklung eines Extraktionsalgorithmus von Schlüsselwörtern aus Webseiten, Clustering von Webseiten und Klassifizierung.

Aufgaben: Entwicklung und Implementierung eines Algorithmus für die Bestimmung von Schlagwörtern für Webseiten; Erstellung eines Webseitencrawlers zur Extraktion sichtbaren Textes von Webseiten; Erstellung einer Demo (Frontend, API) für den Algorithmus.




networkx scikit-learn Matplotlb Numpy Pandas Jupyter Lab/Notebooks Selenium Scrapy Git Excel
Python JavaScript
[Auf Anfrage]

Aus- und Weiterbildung

4 Jahre 7 Monate
2016-04 - 2020-10

Informationswirtschaft

M.Sc., Karlsruher Institut für Technologie
M.Sc.
Karlsruher Institut für Technologie

Vertiefungsgebiete:  Webscraping, Natural Language Processing, Information Retrieval


Programmiersprachen: Python, Java, JavaScript

4 Jahre 4 Monate
2011-10 - 2016-01

Wirtschaftsingenieurwesen

B.Sc., Karlsruher Institut für Technologie
B.Sc.
Karlsruher Institut für Technologie

Vertiefungsgebiete: Recommender-Systeme

Programmiersprachen: Scala

Tools und Methoden: Akka, Apache Mahout

Position

Data Scientist / Data Engineer / Softwareentwickler Machine Learning

- Beratung und Abschätzung zu Machine Learning Use Cases

- Auswahl, Implementierung, Evaluation und Weiterentwicklung von ML Modellen für z.B. Vorhersage oder Analyse von Daten, darunter Computer Vision und Natural Language Processing / Understanding

- Umsetzung von Datenpipelines, Extraktion, Speicherung und Verarbeitung von Daten

- Inbetriebnahme von Machine Learning Modellen, Deployment in der Cloud oder on Premise, Containerisierung, Integration in CI/CD

Kompetenzen

Schwerpunkte

Computer Vision
Deep Learning
Machine Learning
Natural Language Processing
Natural Language Understanding
Recommender Systeme
Time Series Analysis

Produkte / Standards / Erfahrungen / Methoden

Apache Mahout
Docker
ElasticSearch
Git
Jupyter
Machine Learning as a Service
Microsoft Azure
Web Scraping
Weka
Confluence
JIRA
Angular
Selenium
Play Framework
RxJS
Spark
Oracle
Kubernetes
Linux
Spring Boot
Flask
Google Polymer
Keras
NumPy
PyTorch
ReactJS
scikit-learn
SciPy
Scrapy
TensorFlow
TensorFlowJS
Text2Vec
Torch

Programmiersprachen

Java
JavaScript
PHP
ReactJS
Scala
Python
TypeScript
R

Datenbanken

MySQL

Vertrauen Sie auf GULP

Im Bereich Freelancing
Im Bereich Arbeitnehmerüberlassung / Personalvermittlung

Fragen?

Rufen Sie uns an +49 89 500316-300 oder schreiben Sie uns:

Das GULP Freelancer-Portal

Direktester geht's nicht! Ganz einfach Freelancer finden und direkt Kontakt aufnehmen.