Data Scientist
Aktualisiert am 16.05.2024
Profil
Mitarbeiter eines Dienstleisters
Remote-Arbeit
Verfügbar ab: 21.05.2024
Verfügbar zu: 100%
davon vor Ort: 100%
Skill-Profil eines fest angestellten Mitarbeiters des Dienstleisters

Einsatzorte

Einsatzorte

Deutschland, Schweiz, Österreich
möglich

Projekte

Projekte

3 Monate
2024-03 - heute

KIPRT-Projekt

Software Entwickler Pyhon FastAPI Starlette ...
Software Entwickler

Entwicklung eines Backends zur automatisierten Ähnlichkeitsbestimmung von Skill-Sets basierend auf der ?SkillExplorer?-Technologie.

Pyhon FastAPI Starlette Uvicorn Numpy Scipy Gensim Pydantic SQLAlchemy Alembic Dynaconf Gitlab CI/CD Dockerfile Docker-Compose PostgreSQL SQLite Poetry Ruff
2 Jahre 8 Monate
2021-10 - heute

SkillExplorer-Projekt

Data Scientist Python NumPy Scikit-Learn ...
Data Scientist

Weiterentwicklung eines HR-Tools zur Optimierung von Personalentscheidungen in IT-Projekt- und Stellenbesetzung sowie Entwicklung. Aufbau und Qualitätssicherung einer Data-Pipeline für IT-Skills, basierend auf Daten von 250 Mio. GitHub-Repositories und angereichert mit Wikipedia/DBPedia-Informationen.

 

-     Datenbeschaffung

-     Datenbereinigung

-     Datensatzerzeugung

-     Erstellung einer Trainingspipeline

-     Identifikation von Evaluationmetriken

-     Vergleich von KI-Modellen

-     Erstellung und Wartung einer CICD-Pipeline

-     Weiterentwicklung der Streamlit-Web-App als PoC.

-     Entwicklung und Wartung von Use-Cases

-     Aufbau und Erweiterung einer Confluence-Page

-     Erweiterung und Updaten der Dokumentation in den erstellten Code-Repositorys

-     Erläuterung der Technologien und Zukunftsaussichten des SkillExplorers bei der AWESOME! Software GmbH.

Python NumPy Scikit-Learn Numpy Scipy Gensim Streamlit Hugging Face GitLab CI/CD Linux Dockerfile Docker-Compose MongoDB Neo4J Confluence
6 Monate
2022-10 - 2023-03

Layoutanalyse

Übungsgruppenleiter ?Diskrete Strukturen? Python PyTorch PyTorch-Lightning ...
Übungsgruppenleiter ?Diskrete Strukturen?

Entwicklung einer Methode zur automatischen Bestimmung der Lesereihenfolge von eingescannten Dokumenten mittels Layout-Analyse, einschließlich:

- Datenpipeline für Datenbereinigung und -anreicherung

- Feature Engineering zur Anreicherung der Rohdaten in der Datenpipeline

- OCR-basierte Worterkennung und Clustering zur Absatzbildung;

- Prototypische KI zur Ermittlung der Lesereihenfolge.

- Halbzeitpräsentation der Erkenntnisse in einer Poster-Session. 


Die finalen Ergebnisse wurden in einer wissenschaftlichen Ausarbeitung zusammengefasst und in einer Präsentation den Stakeholdern vorgestellt.


Wöchentliche Termine ermöglichen Studierenden, Fragen zu Aufgaben und Vorlesungen zu klären. Einmal pro Semester können sie gelöste Aufgaben vorstellen, wobei ihre Erklärungen die Abschlussnote verbessern können. Probleme werden in Zusammenarbeit mit dem Professor gelöst. Gruppengröße liegt bei 20-30 Studierenden; insgesamt wurden drei Gruppen betreut.

Python PyTorch PyTorch-Lightning OpenCV NumPy Scikit-Learn Jupiter Notebooks Weights&Biases GitLab
6 Monate
2022-04 - 2022-09

Human Activity Recognition

Praktikumsleiter ?Programmiermethoden und -techniken? Python PyTorch PyTorch-Lightning ...
Praktikumsleiter ?Programmiermethoden und -techniken?

Training und Vergleich von KI-Modellen zur Klassifikation menschlicher Bewegungen mit Apple Watch-Sensordaten, inklusive

- Implementierung eines Self-Supervised Machine Learning Modells;

- Aufbau einer Datenpipeline zur Datensegmentierung/-aufbereitung und schneller Inferenz ohne Skalierung der Hardware.

 

Präsentation der Zwischenergebnisse in einer Poster-Session und finale schriftliche Ausarbeitung für Stakeholder.


Wöchentliche Termine klären Fragen zu Aufgaben und Vorlesungsinhalten. Der Fokus liegt auf individueller Betreuung zur Vermittlung von Programmierparadigmen. Studierende erledigen wöchentliche Hausaufgaben, die analysiert und kommentiert werden, mit ständigem Austausch zwischen dem Dozent und Praktikumsleitern. 


Betreut wurden 15-20 Studierenden in insgesamt zwei Gruppen.

Python PyTorch PyTorch-Lightning Weights&Biases NumPy Scikit-Learn Tensorboard MySQL Linux Ubuntu 20.04 GitLab
7 Monate
2021-04 - 2021-10

Software-Developer bei der Commerzbank

C# C# .NET SQL ...

Im Scrum-Team übernahm er Aufgaben wie:

-          Wartung/Erweiterung von Compliance-Software,

-          Datenpflege im CRM,

-          Quartalspräsentationen für Stakeholder,

-          Cloud-Migrationsplanung,

-          Teamkoordination (3 Entwickler).

C# C# .NET SQL Windows Server Linux Jira Confluence CRM Cloud BitBucket
3 Monate
2021-01 - 2021-03

KI-basiertes Fragen-Antwortsystem

Python PyTorch Hugging Face ...

Aus Wikipedia-Artikeln extrahierte Frage-Antwort-Paare (Faktoids) wurden für die Entwicklung eines KI-Systems genutzt, das korrekte Antworten findet. Das System identifiziert zunächst Fragentypen zur Vorauswahl und bewertet dann Frage-Antwort-Kombinationen.

 

Dabei kamen folgende Technologien zum Einsatz: NLP-Techniken (Tokenization, Normalization), einem LLM (DistilBERT) und Elasticsearch (effiziente Volltextsuche).

Python PyTorch Hugging Face Tensorboard NumPy Scikit-Learn Elasticsearch Kibana Docker Docker-Compose JSON NLP NLTK spaCy DBPedia RDF-Triplet RESTful
6 Monate
2020-10 - 2021-03

Weiterentwicklung eines Personalmanagementsystems für Kreativfabrik Wiesbaden

Angular 6 Bootstrap CSS ...

Eine Web-Applikation für die Kreativfabrik Wiesbaden wurde zur effizienten Planung und Verwaltung von Personaleinsatz bei Events weiterentwickelt, mit Fokus auf Fehlerbehebungen und Implementierung neuer Features.

Angular 6 Bootstrap CSS Typescript JavaScript PostgreSQL Scrum
10 Monate
2017-12 - 2018-09

Hilfswissenschaftler für Softwarewartung in virtueller Fabrik (TU Darmstadt)

Siemens Plant Simulation
Wartung von Simulationssoftware zur Optimierung von Maschinenbetrieb und -wartung in einer virtuellen Fabrik.
Siemens Plant Simulation
1 Jahr 1 Monat
2016-10 - 2017-10

Hilfswissenschaftler für Arbeitsumgebungseinrichtung (TU Darmstadt)

Windows Server Windchill Joomla

Installation einer PLM-Software für einen Hochschulkurs und Unterstützung bei der Website eines IT-Sicherheitsprojekts in Industrie 4.0

Windows Server Windchill Joomla

Aus- und Weiterbildung

Aus- und Weiterbildung

1 Monat
2024-04 - 2024-04

Zertifizierung

Professional Scrum Master (PSM-I), Scrum.org
Professional Scrum Master (PSM-I)
Scrum.org
1 Monat
2024-03 - 2024-03

Zertifizierung

Professional Scrum Developer (PSD), Scrum.org
Professional Scrum Developer (PSD)
Scrum.org
1 Jahr 1 Monat
2022-01 - 2023-01

Studium

Master of Science Informatik, Hochschule RheinMain, Wiesbaden
Master of Science Informatik
Hochschule RheinMain, Wiesbaden
Masterthesis: ?Code Transfer by Augmentation-based Self-supervised Learning for Language Models?
3 Jahre 1 Monat
2018-01 - 2021-01

Studium

Bachelor of Science Angewandte Informatik, Hochschule RheinMain, Wiesbaden
Bachelor of Science Angewandte Informatik
Hochschule RheinMain, Wiesbaden
Bachlorthesis: ?Ein embedding-basiertes Recommendersystem zur interaktiven Ergänzung von Entwicklerprofilen?

Kompetenzen

Kompetenzen

Produkte / Standards / Erfahrungen / Methoden

Überblick

Fachkompetenz: 

Software-Architektur und Design von KI-Modellen, KI-Modell Training, Data Modelling, Datenanalyse, Datenvisualisierung, Machine Learning, Data Mining, Softwareentwicklung, Deployment von KI-Modellen, ML/Daten-Pipeline, Signal Processing/Signalverarbeitung


IT-Kompetenz: 

Python, FastAPI, Starlette, Uvicorn, RestAPI, BeautifulSoup, OpenCV, Seaborn, Matplotlib, Numpy, Scipy, Ruff, Poetry, Alembic, SQLAlchemy, Pydantic, Scikit-Learn, Pandas, PyTest, Unittest, Jupyter Notebook, Streamlit, Natural Language Toolkit (NLTK), spaCy, Dockerfile, Docker Compose, C# .NET, Bash Scripting, JSON, XML


Produkte:

Confluence, Jira, BitBucket, Github, Gitlab, Overleaf, Weights&Biases, Hugging Face, Ubuntu (Versionen 18.04 - 22.04), Windows Server, Windows, Linux, MacOS, Docker, Weights&Biases, Dockerhub


Methodenkompetenz:

Scrum, Agile, Kanban, Wasserfall, V-Modell, OOP, UML, Design Pattern


Entwicklungswerkzeuge:
 Visual Studio, Visual Studio Code, IntelliJ, PyCharm, Eclipse, Git, SVN, WSL2


Programmiersprachen:

Python, Java, C#, JavaScript


Datenbanken: (SQL/NoSQL) MySQL, MariaDB, PostgreSQL, SQLite, MongoDB, Neo4j


KI-Kompetenzen:

Tensorflow, Keras, PyTorch, TensorBoard, TorchData, Torchvision, PyTorch-Lightning, Autoencoder, Transformer, Klassifizierung, Clustering, Computer Vision, Neuronale Netze (NN), Logistic Regression, Convolutional Neural Nets (CNNs), Natural Language Processing (NLP)


Branchen

Branchen

Forschung, Finanzsektor

Einsatzorte

Einsatzorte

Deutschland, Schweiz, Österreich
möglich

Projekte

Projekte

3 Monate
2024-03 - heute

KIPRT-Projekt

Software Entwickler Pyhon FastAPI Starlette ...
Software Entwickler

Entwicklung eines Backends zur automatisierten Ähnlichkeitsbestimmung von Skill-Sets basierend auf der ?SkillExplorer?-Technologie.

Pyhon FastAPI Starlette Uvicorn Numpy Scipy Gensim Pydantic SQLAlchemy Alembic Dynaconf Gitlab CI/CD Dockerfile Docker-Compose PostgreSQL SQLite Poetry Ruff
2 Jahre 8 Monate
2021-10 - heute

SkillExplorer-Projekt

Data Scientist Python NumPy Scikit-Learn ...
Data Scientist

Weiterentwicklung eines HR-Tools zur Optimierung von Personalentscheidungen in IT-Projekt- und Stellenbesetzung sowie Entwicklung. Aufbau und Qualitätssicherung einer Data-Pipeline für IT-Skills, basierend auf Daten von 250 Mio. GitHub-Repositories und angereichert mit Wikipedia/DBPedia-Informationen.

 

-     Datenbeschaffung

-     Datenbereinigung

-     Datensatzerzeugung

-     Erstellung einer Trainingspipeline

-     Identifikation von Evaluationmetriken

-     Vergleich von KI-Modellen

-     Erstellung und Wartung einer CICD-Pipeline

-     Weiterentwicklung der Streamlit-Web-App als PoC.

-     Entwicklung und Wartung von Use-Cases

-     Aufbau und Erweiterung einer Confluence-Page

-     Erweiterung und Updaten der Dokumentation in den erstellten Code-Repositorys

-     Erläuterung der Technologien und Zukunftsaussichten des SkillExplorers bei der AWESOME! Software GmbH.

Python NumPy Scikit-Learn Numpy Scipy Gensim Streamlit Hugging Face GitLab CI/CD Linux Dockerfile Docker-Compose MongoDB Neo4J Confluence
6 Monate
2022-10 - 2023-03

Layoutanalyse

Übungsgruppenleiter ?Diskrete Strukturen? Python PyTorch PyTorch-Lightning ...
Übungsgruppenleiter ?Diskrete Strukturen?

Entwicklung einer Methode zur automatischen Bestimmung der Lesereihenfolge von eingescannten Dokumenten mittels Layout-Analyse, einschließlich:

- Datenpipeline für Datenbereinigung und -anreicherung

- Feature Engineering zur Anreicherung der Rohdaten in der Datenpipeline

- OCR-basierte Worterkennung und Clustering zur Absatzbildung;

- Prototypische KI zur Ermittlung der Lesereihenfolge.

- Halbzeitpräsentation der Erkenntnisse in einer Poster-Session. 


Die finalen Ergebnisse wurden in einer wissenschaftlichen Ausarbeitung zusammengefasst und in einer Präsentation den Stakeholdern vorgestellt.


Wöchentliche Termine ermöglichen Studierenden, Fragen zu Aufgaben und Vorlesungen zu klären. Einmal pro Semester können sie gelöste Aufgaben vorstellen, wobei ihre Erklärungen die Abschlussnote verbessern können. Probleme werden in Zusammenarbeit mit dem Professor gelöst. Gruppengröße liegt bei 20-30 Studierenden; insgesamt wurden drei Gruppen betreut.

Python PyTorch PyTorch-Lightning OpenCV NumPy Scikit-Learn Jupiter Notebooks Weights&Biases GitLab
6 Monate
2022-04 - 2022-09

Human Activity Recognition

Praktikumsleiter ?Programmiermethoden und -techniken? Python PyTorch PyTorch-Lightning ...
Praktikumsleiter ?Programmiermethoden und -techniken?

Training und Vergleich von KI-Modellen zur Klassifikation menschlicher Bewegungen mit Apple Watch-Sensordaten, inklusive

- Implementierung eines Self-Supervised Machine Learning Modells;

- Aufbau einer Datenpipeline zur Datensegmentierung/-aufbereitung und schneller Inferenz ohne Skalierung der Hardware.

 

Präsentation der Zwischenergebnisse in einer Poster-Session und finale schriftliche Ausarbeitung für Stakeholder.


Wöchentliche Termine klären Fragen zu Aufgaben und Vorlesungsinhalten. Der Fokus liegt auf individueller Betreuung zur Vermittlung von Programmierparadigmen. Studierende erledigen wöchentliche Hausaufgaben, die analysiert und kommentiert werden, mit ständigem Austausch zwischen dem Dozent und Praktikumsleitern. 


Betreut wurden 15-20 Studierenden in insgesamt zwei Gruppen.

Python PyTorch PyTorch-Lightning Weights&Biases NumPy Scikit-Learn Tensorboard MySQL Linux Ubuntu 20.04 GitLab
7 Monate
2021-04 - 2021-10

Software-Developer bei der Commerzbank

C# C# .NET SQL ...

Im Scrum-Team übernahm er Aufgaben wie:

-          Wartung/Erweiterung von Compliance-Software,

-          Datenpflege im CRM,

-          Quartalspräsentationen für Stakeholder,

-          Cloud-Migrationsplanung,

-          Teamkoordination (3 Entwickler).

C# C# .NET SQL Windows Server Linux Jira Confluence CRM Cloud BitBucket
3 Monate
2021-01 - 2021-03

KI-basiertes Fragen-Antwortsystem

Python PyTorch Hugging Face ...

Aus Wikipedia-Artikeln extrahierte Frage-Antwort-Paare (Faktoids) wurden für die Entwicklung eines KI-Systems genutzt, das korrekte Antworten findet. Das System identifiziert zunächst Fragentypen zur Vorauswahl und bewertet dann Frage-Antwort-Kombinationen.

 

Dabei kamen folgende Technologien zum Einsatz: NLP-Techniken (Tokenization, Normalization), einem LLM (DistilBERT) und Elasticsearch (effiziente Volltextsuche).

Python PyTorch Hugging Face Tensorboard NumPy Scikit-Learn Elasticsearch Kibana Docker Docker-Compose JSON NLP NLTK spaCy DBPedia RDF-Triplet RESTful
6 Monate
2020-10 - 2021-03

Weiterentwicklung eines Personalmanagementsystems für Kreativfabrik Wiesbaden

Angular 6 Bootstrap CSS ...

Eine Web-Applikation für die Kreativfabrik Wiesbaden wurde zur effizienten Planung und Verwaltung von Personaleinsatz bei Events weiterentwickelt, mit Fokus auf Fehlerbehebungen und Implementierung neuer Features.

Angular 6 Bootstrap CSS Typescript JavaScript PostgreSQL Scrum
10 Monate
2017-12 - 2018-09

Hilfswissenschaftler für Softwarewartung in virtueller Fabrik (TU Darmstadt)

Siemens Plant Simulation
Wartung von Simulationssoftware zur Optimierung von Maschinenbetrieb und -wartung in einer virtuellen Fabrik.
Siemens Plant Simulation
1 Jahr 1 Monat
2016-10 - 2017-10

Hilfswissenschaftler für Arbeitsumgebungseinrichtung (TU Darmstadt)

Windows Server Windchill Joomla

Installation einer PLM-Software für einen Hochschulkurs und Unterstützung bei der Website eines IT-Sicherheitsprojekts in Industrie 4.0

Windows Server Windchill Joomla

Aus- und Weiterbildung

Aus- und Weiterbildung

1 Monat
2024-04 - 2024-04

Zertifizierung

Professional Scrum Master (PSM-I), Scrum.org
Professional Scrum Master (PSM-I)
Scrum.org
1 Monat
2024-03 - 2024-03

Zertifizierung

Professional Scrum Developer (PSD), Scrum.org
Professional Scrum Developer (PSD)
Scrum.org
1 Jahr 1 Monat
2022-01 - 2023-01

Studium

Master of Science Informatik, Hochschule RheinMain, Wiesbaden
Master of Science Informatik
Hochschule RheinMain, Wiesbaden
Masterthesis: ?Code Transfer by Augmentation-based Self-supervised Learning for Language Models?
3 Jahre 1 Monat
2018-01 - 2021-01

Studium

Bachelor of Science Angewandte Informatik, Hochschule RheinMain, Wiesbaden
Bachelor of Science Angewandte Informatik
Hochschule RheinMain, Wiesbaden
Bachlorthesis: ?Ein embedding-basiertes Recommendersystem zur interaktiven Ergänzung von Entwicklerprofilen?

Kompetenzen

Kompetenzen

Produkte / Standards / Erfahrungen / Methoden

Überblick

Fachkompetenz: 

Software-Architektur und Design von KI-Modellen, KI-Modell Training, Data Modelling, Datenanalyse, Datenvisualisierung, Machine Learning, Data Mining, Softwareentwicklung, Deployment von KI-Modellen, ML/Daten-Pipeline, Signal Processing/Signalverarbeitung


IT-Kompetenz: 

Python, FastAPI, Starlette, Uvicorn, RestAPI, BeautifulSoup, OpenCV, Seaborn, Matplotlib, Numpy, Scipy, Ruff, Poetry, Alembic, SQLAlchemy, Pydantic, Scikit-Learn, Pandas, PyTest, Unittest, Jupyter Notebook, Streamlit, Natural Language Toolkit (NLTK), spaCy, Dockerfile, Docker Compose, C# .NET, Bash Scripting, JSON, XML


Produkte:

Confluence, Jira, BitBucket, Github, Gitlab, Overleaf, Weights&Biases, Hugging Face, Ubuntu (Versionen 18.04 - 22.04), Windows Server, Windows, Linux, MacOS, Docker, Weights&Biases, Dockerhub


Methodenkompetenz:

Scrum, Agile, Kanban, Wasserfall, V-Modell, OOP, UML, Design Pattern


Entwicklungswerkzeuge:
 Visual Studio, Visual Studio Code, IntelliJ, PyCharm, Eclipse, Git, SVN, WSL2


Programmiersprachen:

Python, Java, C#, JavaScript


Datenbanken: (SQL/NoSQL) MySQL, MariaDB, PostgreSQL, SQLite, MongoDB, Neo4j


KI-Kompetenzen:

Tensorflow, Keras, PyTorch, TensorBoard, TorchData, Torchvision, PyTorch-Lightning, Autoencoder, Transformer, Klassifizierung, Clustering, Computer Vision, Neuronale Netze (NN), Logistic Regression, Convolutional Neural Nets (CNNs), Natural Language Processing (NLP)


Branchen

Branchen

Forschung, Finanzsektor

Vertrauen Sie auf GULP

Im Bereich Freelancing
Im Bereich Arbeitnehmerüberlassung / Personalvermittlung

Fragen?

Rufen Sie uns an +49 89 500316-300 oder schreiben Sie uns:

Das GULP Freelancer-Portal

Direktester geht's nicht! Ganz einfach Freelancer finden und direkt Kontakt aufnehmen.