Data Scientist mit Expertise in einer Vielzahl von Machine Learning-Konzepten, einschließlich Natural Language Processing (NLP), u.a.
Aktualisiert am 14.05.2024
Profil
Mitarbeiter eines Dienstleisters
Remote-Arbeit
Verfügbar ab: 03.05.2024
Verfügbar zu: 100%
davon vor Ort: 100%
Skill-Profil eines fest angestellten Mitarbeiters des Dienstleisters
Deutsch
Grundkenntnisse
Englisch
Muttersprache
Kannada
Muttersprache
Hindi
Grundkenntnisse

Einsatzorte

Einsatzorte

Deutschland
möglich

Projekte

Projekte

1 Jahr 4 Monate
2023-01 - heute

Reinforcement Learning

Data Scientist Python DQN A2C ...
Data Scientist
Dieses Projekt konzentrierte sich auf das Reinforcement Learning und hatte zum Ziel, den DQN-Reinforcement-Algorithmus auf CAD-Daten anzuwenden, um Designs zu optimieren. Die Wirksamkeit der Optimierung wurde anhand der Ergebnisse aus dem Abaqus-Tool bewertet, in das die neu gestalteten CAD-Teile eingegeben wurden. Der Reinforcement-Learning-Algorithmus durchlief Iterationen, bis die gewünschten Spannungswerte für die optimalste Form erreicht wurden. Darüber hinaus wurden alternative Ansätze wie Varianten des Actor-Critic-Algorithmus erforscht, um eine weitere Optimierung zu erreichen.
Python DQN A2C Gym libraries CAD Abaqus
KMU
1 Jahr 4 Monate
2023-01 - heute

KI-basierte Qualitätssicherung von Kunststoffspritzgussbauteilen

Data Scientist CNNs: Custom Models using Pytorch and Tensorflow Data Preprocessing techniques: OpenCV2 tools Manual defect generation ...
Data Scientist
In einem fortschrittlichen Projekt zur Verbesserung der Qualitätssicherung in der Fertigung spielte der Entwickler eine Schlüsselrolle durch die Spezialisierung auf den Einsatz von Convolutional Neural Networks (CNNs) für die Echtzeit-Defekterkennung. Durch die Entwicklung maßgeschneiderter CNN-Modelle unter Verwendung von PyTorch und TensorFlow gelang es dem Team, ein System zu konzipieren, das fähig ist, Defekte an Bauteilen zu identifizieren. Ein zentraler Bestandteil des Projekts war die Implementierung eines Multiwinkel-Bildaufnahmemechanismus, der es ermöglichte, Komponentenbilder aus verschiedenen Perspektiven zu erfassen. Diese Bilder wurden anschließend zur Analyse in die CNN-Modelle eingespeist. Um die Echtzeit-Performance zu gewährleisten, erfolgte der Inferenzprozess direkt auf Edge-Geräten wie dem Jetson, die mit den Inspektionskameras verbunden waren. Dieser Ansatz ermöglichte eine schnelle und effiziente Defekterkennung direkt an der Produktionslinie, ohne die Notwendigkeit, Daten erst an eine zentrale Verarbeitungseinheit zu senden. Die Verwaltung des gesamten Projektworkflows erfolgte über MLFlow, was eine systematische Nachverfolgung der Experimente, Modelle und Trainingsdaten ermöglichte. Dieses Tool spielte eine entscheidende Rolle bei der Optimierung des Entwicklungsprozesses und der Sicherstellung der Reproduzierbarkeit der Ergebnisse.
CNNs: Custom Models using Pytorch and Tensorflow Data Preprocessing techniques: OpenCV2 tools Manual defect generation Grabcut and and other Preprocessing algorithms Pretrained models: VGG16; DenseNet; ResNet; Inception V3 etc Prototyping GUI tools: Streamlit Raspi hardware programming Inferencing pipeline
Elektronikhersteller
5 Monate
2023-04 - 2023-08

Context-Based LLM

Data Scientist Python GPT3 LangChain ...
Data Scientist
Sie waren an der Entwicklung eines kontextbasierten Frage-Antwort-Systems beteiligt, das auf großen Sprachmodellen (LLMs) basiert und speziell auf unternehmensbezogene Anfragen zugeschnitten ist. Durch eine gründliche Evaluierung verschiedener Open-Source-Modelle wie Falcon, Llama, und kommerzieller Lösungen einschließlich GPT-3 gewährleisteten sie die Vielseitigkeit des Systems. Benutzer können das für ihre Bedürfnisse am besten geeignete Modell auswählen. Das System akzeptiert benutzerbereitgestellte Dokumente oder nutzt Modelle, die auf relevanten Unternehmens- oder Domänendaten feinabgestimmt sind. Bemerkenswert ist, dass es prägnante Antworten liefert, ergänzt durch erklärbare Rechtfertigungen über interaktive Grafiken, die Ähnlichkeiten zwischen der Anfrage und den Quelldokumenten aufzeigen. Diese Funktion stattet Benutzer mit den Einblicken aus, die sie benötigen, um informierte Entscheidungen basierend auf den generierten Antworten zu treffen.
Python GPT3 LangChain Falcon Llama Streamlit Similarity measures
KMU
11 Monate
2022-08 - 2023-06

Entity Extraction using NLP Approaches

Developer Python BERT Flair ...
Developer
In diesem Projekt konzentriert sich die Arbeit auf die Extraktion und Klassifizierung von Informationen unter Verwendung mehrerer NLP-Basistechniken sowie einer verbesserten Form der Named Entity Recognition (NER), um benutzerdefinierte Entitätstypen entsprechend den Geschäftsanforderungen zu identifizieren.
Python BERT Flair Spacey GPT
4 Monate
2022-04 - 2022-07

Constrained Clustering on Text data with Explainability

Developer Python Vorverarbeitungstechniken Merkmalsauswahl und -reduktionTechniken ...
Developer
In diesem Projekt liegt der Fokus auf der Generierung von Textclustern mittels eingeschränkter Clusterverfahren und der Bereitstellung textueller Erklärungen für diese Cluster. Die zentralen Fragestellungen umfassen: Aus welchen Gründen sind mehrere Datenpunkte in einem Cluster zusammengefasst? Warum werden zwei Datenpunkte unterschiedlichen Clustern zugeordnet? Und was ist die übergreifende Erklärung dafür?
Python Vorverarbeitungstechniken Merkmalsauswahl und -reduktionTechniken Doc2Vec PCK-means Constraint Clustering Key-Phrasification Erklärbarkeit
6 Monate
2021-11 - 2022-04

Uncertainty Management for Learned Cardinality Estimation with Conformal

Developer Python Neurocard MSCN ...
Developer
In diesem Projekt wurde die traditionelle Technik der Kardinalitätsschätzung erfolgreich erweitert, indem neben Punktprognosen auch Konfidenzniveaus und Unsicherheitsmaße für die Kardinalitätsschätzungen bestimmter Abfragen bereitgestellt wurden. Durch die Konstruktion eines Ensembles mit den bestehenden Methoden des aktuellen Stands der Technik konnte die Genauigkeit der Schätzungen signifikant verbessert und die Unsicherheitsmaße effektiv reduziert werden.
Python Neurocard MSCN BNNs
3 Monate
2020-11 - 2021-01

Information Retrieval Project - Search Engine

Developer Python Textvorverarbeitung Merkmalsextraktion mit Tf-Idf
Developer
Entwicklung einer Search Engine Anwendung mit Apache Lucene. Diese Anwendung erzeugt textuelle Ergebnisse und dazugehörigen grafischen Bilder in der Reihenfolge der Relevanz zur Suchanfrage.
Python Textvorverarbeitung Merkmalsextraktion mit Tf-Idf
4 Monate
2017-02 - 2017-05

IOT Based Accident Vehicle Detection System

Developer IOT Arduino Mikrocontroller Verschiedene Sensor (Druck und Annäherung) Android App Entwicklung ...
Developer
Dieses Projekt, bei dem es hauptsächlich um das "Internet der Dinge" geht, ist ein komplettes System das sowohl aus Software- als auch aus Hardware-Elementen besteht. Die Hardware-Komponente wird am Fahrzeug montiert und dient zur Erfassung des Aufpralls, während die Software eine eine Android-Anwendung, die auf dem mobilen Gerät des Fahrers installiert ist. Bei der Erkennung eines eines Aufpralls, der einen zulässigen Schwellenwert überschreitet, würde das System automatisch ein ein Notfallprotokoll.
IOT Arduino Mikrocontroller Verschiedene Sensor (Druck und Annäherung) Android App Entwicklung Arduino Programmierung

Aus- und Weiterbildung

Aus- und Weiterbildung

2024
Studium - Data Knowledge and Engineering
Otto-von-Guericke-Universität
Abschluss: Master

Zertifizierung

2022
  • Essential Google Cloud Infrastructure: Foundation
  • Reliable Google Cloud Infrastructure: Design and Process
  • Essential Google Cloud Infrastructure: Core Services
  • Essential Google Cloud Infrastructure: Scaling and Automation
  • Google Cloud Fundamentals: Core Infrastructure

Position

Position

IT Consultant

Kompetenzen

Kompetenzen

Schwerpunkte

Data Scientist mit Expertise in einer Vielzahl von Machine Learning-Konzepten, einschließlich Natural Language Processing (NLP), Data Clustering, Visual Analytics, Information Retrieval, Internet of Things (IoT) und Computer Vision.

Produkte / Standards / Erfahrungen / Methoden

Technologien und Tools
  • Methoden
    • Scrum 
    • agile Entwicklungsmethoden
    • Machine Learning 
    • Deep Learning principles
  • Frameworks
    • Pytorch
    • Tensorflow
    • Streamlit
  • Tools/Software
    • BERT
    • Flair
    • Spacey
    • GPT
    • Doc2Vec
    • PCK-Means Constraint Clustering
    • Google Cloud Infrastructure
    • Kubernetes
    • Gym environments for Reinforcement Learning
    • Object Detection (Yolo)
    • Pose Estimation - Mask R-CNN
    • PoseNet
    • OpenPose
    • Key-Point-Tracking - DeepLabCut
    • CNN Classification (VGG, ResNet, Inception, DenseNet)
    • Custom trained model
    • Data Preprocessing
    • Grabcut Segmentation
    • OpenCV tools
    • Falcon
    • Llama
    • Langchain
    • Linux

Programmiersprachen

Python
C++
C#
Java

Datenbanken

MySQL

Einsatzorte

Einsatzorte

Deutschland
möglich

Projekte

Projekte

1 Jahr 4 Monate
2023-01 - heute

Reinforcement Learning

Data Scientist Python DQN A2C ...
Data Scientist
Dieses Projekt konzentrierte sich auf das Reinforcement Learning und hatte zum Ziel, den DQN-Reinforcement-Algorithmus auf CAD-Daten anzuwenden, um Designs zu optimieren. Die Wirksamkeit der Optimierung wurde anhand der Ergebnisse aus dem Abaqus-Tool bewertet, in das die neu gestalteten CAD-Teile eingegeben wurden. Der Reinforcement-Learning-Algorithmus durchlief Iterationen, bis die gewünschten Spannungswerte für die optimalste Form erreicht wurden. Darüber hinaus wurden alternative Ansätze wie Varianten des Actor-Critic-Algorithmus erforscht, um eine weitere Optimierung zu erreichen.
Python DQN A2C Gym libraries CAD Abaqus
KMU
1 Jahr 4 Monate
2023-01 - heute

KI-basierte Qualitätssicherung von Kunststoffspritzgussbauteilen

Data Scientist CNNs: Custom Models using Pytorch and Tensorflow Data Preprocessing techniques: OpenCV2 tools Manual defect generation ...
Data Scientist
In einem fortschrittlichen Projekt zur Verbesserung der Qualitätssicherung in der Fertigung spielte der Entwickler eine Schlüsselrolle durch die Spezialisierung auf den Einsatz von Convolutional Neural Networks (CNNs) für die Echtzeit-Defekterkennung. Durch die Entwicklung maßgeschneiderter CNN-Modelle unter Verwendung von PyTorch und TensorFlow gelang es dem Team, ein System zu konzipieren, das fähig ist, Defekte an Bauteilen zu identifizieren. Ein zentraler Bestandteil des Projekts war die Implementierung eines Multiwinkel-Bildaufnahmemechanismus, der es ermöglichte, Komponentenbilder aus verschiedenen Perspektiven zu erfassen. Diese Bilder wurden anschließend zur Analyse in die CNN-Modelle eingespeist. Um die Echtzeit-Performance zu gewährleisten, erfolgte der Inferenzprozess direkt auf Edge-Geräten wie dem Jetson, die mit den Inspektionskameras verbunden waren. Dieser Ansatz ermöglichte eine schnelle und effiziente Defekterkennung direkt an der Produktionslinie, ohne die Notwendigkeit, Daten erst an eine zentrale Verarbeitungseinheit zu senden. Die Verwaltung des gesamten Projektworkflows erfolgte über MLFlow, was eine systematische Nachverfolgung der Experimente, Modelle und Trainingsdaten ermöglichte. Dieses Tool spielte eine entscheidende Rolle bei der Optimierung des Entwicklungsprozesses und der Sicherstellung der Reproduzierbarkeit der Ergebnisse.
CNNs: Custom Models using Pytorch and Tensorflow Data Preprocessing techniques: OpenCV2 tools Manual defect generation Grabcut and and other Preprocessing algorithms Pretrained models: VGG16; DenseNet; ResNet; Inception V3 etc Prototyping GUI tools: Streamlit Raspi hardware programming Inferencing pipeline
Elektronikhersteller
5 Monate
2023-04 - 2023-08

Context-Based LLM

Data Scientist Python GPT3 LangChain ...
Data Scientist
Sie waren an der Entwicklung eines kontextbasierten Frage-Antwort-Systems beteiligt, das auf großen Sprachmodellen (LLMs) basiert und speziell auf unternehmensbezogene Anfragen zugeschnitten ist. Durch eine gründliche Evaluierung verschiedener Open-Source-Modelle wie Falcon, Llama, und kommerzieller Lösungen einschließlich GPT-3 gewährleisteten sie die Vielseitigkeit des Systems. Benutzer können das für ihre Bedürfnisse am besten geeignete Modell auswählen. Das System akzeptiert benutzerbereitgestellte Dokumente oder nutzt Modelle, die auf relevanten Unternehmens- oder Domänendaten feinabgestimmt sind. Bemerkenswert ist, dass es prägnante Antworten liefert, ergänzt durch erklärbare Rechtfertigungen über interaktive Grafiken, die Ähnlichkeiten zwischen der Anfrage und den Quelldokumenten aufzeigen. Diese Funktion stattet Benutzer mit den Einblicken aus, die sie benötigen, um informierte Entscheidungen basierend auf den generierten Antworten zu treffen.
Python GPT3 LangChain Falcon Llama Streamlit Similarity measures
KMU
11 Monate
2022-08 - 2023-06

Entity Extraction using NLP Approaches

Developer Python BERT Flair ...
Developer
In diesem Projekt konzentriert sich die Arbeit auf die Extraktion und Klassifizierung von Informationen unter Verwendung mehrerer NLP-Basistechniken sowie einer verbesserten Form der Named Entity Recognition (NER), um benutzerdefinierte Entitätstypen entsprechend den Geschäftsanforderungen zu identifizieren.
Python BERT Flair Spacey GPT
4 Monate
2022-04 - 2022-07

Constrained Clustering on Text data with Explainability

Developer Python Vorverarbeitungstechniken Merkmalsauswahl und -reduktionTechniken ...
Developer
In diesem Projekt liegt der Fokus auf der Generierung von Textclustern mittels eingeschränkter Clusterverfahren und der Bereitstellung textueller Erklärungen für diese Cluster. Die zentralen Fragestellungen umfassen: Aus welchen Gründen sind mehrere Datenpunkte in einem Cluster zusammengefasst? Warum werden zwei Datenpunkte unterschiedlichen Clustern zugeordnet? Und was ist die übergreifende Erklärung dafür?
Python Vorverarbeitungstechniken Merkmalsauswahl und -reduktionTechniken Doc2Vec PCK-means Constraint Clustering Key-Phrasification Erklärbarkeit
6 Monate
2021-11 - 2022-04

Uncertainty Management for Learned Cardinality Estimation with Conformal

Developer Python Neurocard MSCN ...
Developer
In diesem Projekt wurde die traditionelle Technik der Kardinalitätsschätzung erfolgreich erweitert, indem neben Punktprognosen auch Konfidenzniveaus und Unsicherheitsmaße für die Kardinalitätsschätzungen bestimmter Abfragen bereitgestellt wurden. Durch die Konstruktion eines Ensembles mit den bestehenden Methoden des aktuellen Stands der Technik konnte die Genauigkeit der Schätzungen signifikant verbessert und die Unsicherheitsmaße effektiv reduziert werden.
Python Neurocard MSCN BNNs
3 Monate
2020-11 - 2021-01

Information Retrieval Project - Search Engine

Developer Python Textvorverarbeitung Merkmalsextraktion mit Tf-Idf
Developer
Entwicklung einer Search Engine Anwendung mit Apache Lucene. Diese Anwendung erzeugt textuelle Ergebnisse und dazugehörigen grafischen Bilder in der Reihenfolge der Relevanz zur Suchanfrage.
Python Textvorverarbeitung Merkmalsextraktion mit Tf-Idf
4 Monate
2017-02 - 2017-05

IOT Based Accident Vehicle Detection System

Developer IOT Arduino Mikrocontroller Verschiedene Sensor (Druck und Annäherung) Android App Entwicklung ...
Developer
Dieses Projekt, bei dem es hauptsächlich um das "Internet der Dinge" geht, ist ein komplettes System das sowohl aus Software- als auch aus Hardware-Elementen besteht. Die Hardware-Komponente wird am Fahrzeug montiert und dient zur Erfassung des Aufpralls, während die Software eine eine Android-Anwendung, die auf dem mobilen Gerät des Fahrers installiert ist. Bei der Erkennung eines eines Aufpralls, der einen zulässigen Schwellenwert überschreitet, würde das System automatisch ein ein Notfallprotokoll.
IOT Arduino Mikrocontroller Verschiedene Sensor (Druck und Annäherung) Android App Entwicklung Arduino Programmierung

Aus- und Weiterbildung

Aus- und Weiterbildung

2024
Studium - Data Knowledge and Engineering
Otto-von-Guericke-Universität
Abschluss: Master

Zertifizierung

2022
  • Essential Google Cloud Infrastructure: Foundation
  • Reliable Google Cloud Infrastructure: Design and Process
  • Essential Google Cloud Infrastructure: Core Services
  • Essential Google Cloud Infrastructure: Scaling and Automation
  • Google Cloud Fundamentals: Core Infrastructure

Position

Position

IT Consultant

Kompetenzen

Kompetenzen

Schwerpunkte

Data Scientist mit Expertise in einer Vielzahl von Machine Learning-Konzepten, einschließlich Natural Language Processing (NLP), Data Clustering, Visual Analytics, Information Retrieval, Internet of Things (IoT) und Computer Vision.

Produkte / Standards / Erfahrungen / Methoden

Technologien und Tools
  • Methoden
    • Scrum 
    • agile Entwicklungsmethoden
    • Machine Learning 
    • Deep Learning principles
  • Frameworks
    • Pytorch
    • Tensorflow
    • Streamlit
  • Tools/Software
    • BERT
    • Flair
    • Spacey
    • GPT
    • Doc2Vec
    • PCK-Means Constraint Clustering
    • Google Cloud Infrastructure
    • Kubernetes
    • Gym environments for Reinforcement Learning
    • Object Detection (Yolo)
    • Pose Estimation - Mask R-CNN
    • PoseNet
    • OpenPose
    • Key-Point-Tracking - DeepLabCut
    • CNN Classification (VGG, ResNet, Inception, DenseNet)
    • Custom trained model
    • Data Preprocessing
    • Grabcut Segmentation
    • OpenCV tools
    • Falcon
    • Llama
    • Langchain
    • Linux

Programmiersprachen

Python
C++
C#
Java

Datenbanken

MySQL

Vertrauen Sie auf GULP

Im Bereich Freelancing
Im Bereich Arbeitnehmerüberlassung / Personalvermittlung

Fragen?

Rufen Sie uns an +49 89 500316-300 oder schreiben Sie uns:

Das GULP Freelancer-Portal

Direktester geht's nicht! Ganz einfach Freelancer finden und direkt Kontakt aufnehmen.