LLM Integration Architect/ Generative AI Platform Engineer (AWS/Azure, LangChain, Cognigy, Amazon Bedrock)
Aktualisiert am 16.06.2026
Profil
Mitarbeiter eines Dienstleisters
Remote-Arbeit
Verfügbar ab: 15.06.2026
Verfügbar zu: 100%
davon vor Ort: 100%
Skill-Profil eines fest angestellten Mitarbeiters des Dienstleisters
Deutsch
Muttersprache
Englisch
Verhandlungssicher

Einsatzorte

Einsatzorte

Deutschland
möglich

Projekte

Projekte

9 Monate
2025-09 - 2026-05

KI-basierter Fahrzeug-Konfigurations Assistent für einen führenden Automobilhersteller

LLM Integration Expert Python Java Solution Design ...
LLM Integration Expert

Design und Entwicklung eines Backend-Agents, der aus Nutzereingaben personalisierte Konfigurationsempfehlungen für Fahrzeuge ableitet. Der Agent nutzt ein LLM-API für Reasoning und ruft über angebundene Tools verschiedene interne APIs auf, um Daten zu kombinieren (Fahrzeugdetails, Konfigurationsmöglichkeiten, Modellverfügbarkeiten, etc.). Er arbeitet als ?Intelligence Layer? in einer Multi-Agent-Architektur. Die Interaktion mit dem Kunden erfolgt in einem separieren Chatbot auf einer frei zugänglichen Webseite.


Aufgaben:
  • Definition der Produktvision und Zielarchitektur
  • Erstellung von Domänen- und Schnittstellenmodellen
  • Entwurf von Tool-Calling-Patterns
  • Definition der Business-Logik
  • Abstimmung mit Business, Compliance und Engineering zur Sicherstellung von Qualität und Skalierbarkeit


Anthropic Claude Quarkus ChatGPT LangChain MCP PostgreSQL AWS
Python Java Solution Design OpenAPI
München
9 Monate
2025-07 - 2026-03

KI-Agent zur Bearbeitung und Unterstützung von Anfragen in einer Steuerkanzlei

LLM Integration Expert Python Azure Google Cloud ...
LLM Integration Expert

Aufbau eines KI-gestütztes Kommunikationssystems, das schnelle, präzise und personalisierte Antworten auf Mandantenanfragen in einer Steuerkanzlei liefert. Durch die Automatisierung routinemäßiger Interaktionen und kontinuierliches Lernen aus vergangenen Fällen verbessert es die Reaktionsfähigkeit und entlastet Fachkräfte, damit sie sich auf komplexe Beratungsaufgaben konzentrieren können.


Aufgaben:

  • Unterstützung bei der Konfiguration und Erweiterung der vom Kunden eingesetzten KI-Plattform
  • Anbindung eines in der EU bereitgestellten LLM zur DSGVO-konformen Nutzung der Applikation
  • Evaluation und Implementierung von Anonymisierungsverfahren, um textuelle Anfragen der Kunden DSGVO-konform zu schwärzen
  • Konfiguration einer Vektordatenbank und Anbindung der Datenbank an die vom Kunden eingesetzte KI-Plattform
  • Konzeption & Implementierung RAG-Architektur mit Amazon Bedrock + Pinecone
  • Integration & Indexierung strukturierter/unstrukturierter Datenquellen inkl. Metadatenmanagement
  • Semantische Suche & Embeddings für juristische Fachdokumente
  • Evaluation der Antwortqualität (Halluzinationsvermeidung, Prompt Engineering, Retrieval-Qualität)

Open WebUI Google Cloud Vertex AI Platform Google Gemini Microsoft Presidio Azure LiteLLM Pinecone Amazon Bedrock
Python Azure Google Cloud AWS Solution Design Responsible AI Datensicherheit
Hannover
5 Monate
2025-05 - 2025-09

KI-gesteuerte Automatisierung des IT-Support-Lifecycles eines führenden Automobilherstellers

LLM Integration Expert Python AWS
LLM Integration Expert

Entwicklung einer KI-Lösung, die den gesamten IT-Support-Lifecycle im Unternehmen intelligent automatisiert. Durch den Einsatz von Large Language Models (LLMs) für automatisiertes Ticket-Triage und vernetzten Multi-Agenten-Systemen zur Ursachenanalyse werden Bearbeitungszeiten verkürzt, Routing-Fehler reduziert und Supportkosten gesenkt. Das System nutzt ein verteiltes Agentennetzwerk, das über das A2A-Protokoll (Agent-to-Agent) kommuniziert und MCP für den Datenabruf einsetzt, um komplexe Unternehmensprozesse effizient zu unterstützen. 


Aufgaben:

  • Definition der Produktvision und Zielarchitektur
  • Erstellung von Domänen- und Schnittstellenmodellen
  • Entwurf von Tool-Calling-Patterns
  • Definition des Verhaltensmodells für die Kommunikation zwischen KI-Agenten
  • Integration von Grafana Tempo als Datenquelle für strukturierte und unstrukturierte Trace-Daten
  • Erstellung und Pflege technischer Dokumentationen

AWS Anthropic Claude Google A2A MCP
Python AWS
München
1 Jahr 1 Monat
2024-01 - 2025-01

Virtueller Banking-KI-Assistent für eine führende internationale Bank

LLM Integration Expert EU AI Act Solution Design AI Red Teaming ...
LLM Integration Expert

Konzeption und Architekturdesign für die technische Integration eines virtuellen Bankassistenten in die Mobile-Banking-Anwendung einer führenden international agierenden Bank. Der Fokus lag auf dem Aufbau einer skalierbaren Architektur unter Einsatz von Sprachmodellen, Avatar-Generierungsmodellen und Cloud-Technologien. Besondere Beachtung fanden dabei die bankinternen Richtlinien für KI-Anwendungen sowie die Anforderungen des EU AI Acts.


Aufgaben:
  • Definition der Zielarchitektur
  • Erstellung der Nachweisdokumentation für die Erfüllung des EU AI Acts
  • Erarbeitung von Maßnahmen für die Sicherstellung der von der Applikation ausgehenden Fairness und Transparenz
  • Herleitung von Maßnahmen für die Erhöhung der Robustheit der Applikation durch standardisierte Red-Teaming-Verfahren und passende Architekturmuster

Technologien:

  • Microsoft Azure
  • Azure OpenAI Service
  • Azure Text to Speech Avatar (TTS-Avatar)
  • Azure Speech to Text (STT)
  • OpenAI GPT-4
  • Azure AI Search
  • Cognigy AI



Azure Azure OpenAI Service Azure AI Search Cognigy AI Text-to-Speech
EU AI Act Solution Design AI Red Teaming Responsible AI Prompt Engineering
Frankfurt am Main
1 Jahr
2022-07 - 2023-06

ML-gestützte Optimierung von KYC-Prozessen in einer internationalen Bank

ML Solution Architect Python Google Cloud
ML Solution Architect

Begleitung des Go-Live von ML-Anwendungen zur Steigerung der Effizienz von KYC-(Know Your Customer)-Prozessen für eine führende international agierende Bank. Ziel des Projekts war die Optimierung bestehender Workflows sowie die Sicherstellung einer skalierbaren und regulatorisch konformen IT-Systemlandschaft. Durch die enge Verzahnung von fachlicher und technischer Unterstützung wurde eine stabile, revisionssichere und zukunftsfähige Lösung geschaffen. So konnten Compliance-Anforderungen effizient erfüllt und die Gesamtperformance der KYC-Prozesse deutlich verbessert werden.


Aufgaben:
  • Analyse der aktuellen KYC-Prozesse und Ableitung von Anforderungen für ML-Modelle und IT-Systeme.
  • Erstellung technischer Dokumentation, einschließlich Architektur- und Sequenzdiagrammen, Komponentenbeschreibungen, Datenbankschemata und Release-Notes.
  • Definition und Einhaltung regulatorischer Vorgaben wie Datenschutz, Betriebskonzepte, Testframeworks und Rollenmodelle.

  • Steuerung der Stakeholder-Kommunikation, Erstellung und Freigabe von User Stories sowie Abstimmung zwischen Fach- und Technikteams.
  • Integration KI-gestützter Entscheidungsunterstützung in bestehende Onboarding- und Monitoring-Workflows

Google Cloud Apache Spark Google BigTable Google BigQuery Qlik Automic Software FastAPI
Python Google Cloud
Frankfurt am Main

Aus- und Weiterbildung

Aus- und Weiterbildung

3 Jahre 11 Monate
2017-10 - 2021-08

Business IT

B.Sc.,
B.Sc.

Kompetenzen

Kompetenzen

Schwerpunkte

LLM Integration
Experte
AI Cloud Services
Experte
Generative AI
Experte
ML Ops
Experte
Multi-Agent-Architecture
Experte
EU AI Act
Fortgeschritten
  • Auswahl des relevanten Tech Stacks aus der Cloud (Azure / AWS)
  • Integration von LLMs in It-Landschaften
  • Regulatorik in AI (EU AI Acts)
  • Agent-to-Agent Kommunikation (A2A-Communication)

Branchen

Branchen

  • Retail Banking (Online Banking, Big Data)
  • Automotive (End-Customer, Dealer, Direct Sales)
  • Services (Steuerberatung, Kanzlei)

Einsatzorte

Einsatzorte

Deutschland
möglich

Projekte

Projekte

9 Monate
2025-09 - 2026-05

KI-basierter Fahrzeug-Konfigurations Assistent für einen führenden Automobilhersteller

LLM Integration Expert Python Java Solution Design ...
LLM Integration Expert

Design und Entwicklung eines Backend-Agents, der aus Nutzereingaben personalisierte Konfigurationsempfehlungen für Fahrzeuge ableitet. Der Agent nutzt ein LLM-API für Reasoning und ruft über angebundene Tools verschiedene interne APIs auf, um Daten zu kombinieren (Fahrzeugdetails, Konfigurationsmöglichkeiten, Modellverfügbarkeiten, etc.). Er arbeitet als ?Intelligence Layer? in einer Multi-Agent-Architektur. Die Interaktion mit dem Kunden erfolgt in einem separieren Chatbot auf einer frei zugänglichen Webseite.


Aufgaben:
  • Definition der Produktvision und Zielarchitektur
  • Erstellung von Domänen- und Schnittstellenmodellen
  • Entwurf von Tool-Calling-Patterns
  • Definition der Business-Logik
  • Abstimmung mit Business, Compliance und Engineering zur Sicherstellung von Qualität und Skalierbarkeit


Anthropic Claude Quarkus ChatGPT LangChain MCP PostgreSQL AWS
Python Java Solution Design OpenAPI
München
9 Monate
2025-07 - 2026-03

KI-Agent zur Bearbeitung und Unterstützung von Anfragen in einer Steuerkanzlei

LLM Integration Expert Python Azure Google Cloud ...
LLM Integration Expert

Aufbau eines KI-gestütztes Kommunikationssystems, das schnelle, präzise und personalisierte Antworten auf Mandantenanfragen in einer Steuerkanzlei liefert. Durch die Automatisierung routinemäßiger Interaktionen und kontinuierliches Lernen aus vergangenen Fällen verbessert es die Reaktionsfähigkeit und entlastet Fachkräfte, damit sie sich auf komplexe Beratungsaufgaben konzentrieren können.


Aufgaben:

  • Unterstützung bei der Konfiguration und Erweiterung der vom Kunden eingesetzten KI-Plattform
  • Anbindung eines in der EU bereitgestellten LLM zur DSGVO-konformen Nutzung der Applikation
  • Evaluation und Implementierung von Anonymisierungsverfahren, um textuelle Anfragen der Kunden DSGVO-konform zu schwärzen
  • Konfiguration einer Vektordatenbank und Anbindung der Datenbank an die vom Kunden eingesetzte KI-Plattform
  • Konzeption & Implementierung RAG-Architektur mit Amazon Bedrock + Pinecone
  • Integration & Indexierung strukturierter/unstrukturierter Datenquellen inkl. Metadatenmanagement
  • Semantische Suche & Embeddings für juristische Fachdokumente
  • Evaluation der Antwortqualität (Halluzinationsvermeidung, Prompt Engineering, Retrieval-Qualität)

Open WebUI Google Cloud Vertex AI Platform Google Gemini Microsoft Presidio Azure LiteLLM Pinecone Amazon Bedrock
Python Azure Google Cloud AWS Solution Design Responsible AI Datensicherheit
Hannover
5 Monate
2025-05 - 2025-09

KI-gesteuerte Automatisierung des IT-Support-Lifecycles eines führenden Automobilherstellers

LLM Integration Expert Python AWS
LLM Integration Expert

Entwicklung einer KI-Lösung, die den gesamten IT-Support-Lifecycle im Unternehmen intelligent automatisiert. Durch den Einsatz von Large Language Models (LLMs) für automatisiertes Ticket-Triage und vernetzten Multi-Agenten-Systemen zur Ursachenanalyse werden Bearbeitungszeiten verkürzt, Routing-Fehler reduziert und Supportkosten gesenkt. Das System nutzt ein verteiltes Agentennetzwerk, das über das A2A-Protokoll (Agent-to-Agent) kommuniziert und MCP für den Datenabruf einsetzt, um komplexe Unternehmensprozesse effizient zu unterstützen. 


Aufgaben:

  • Definition der Produktvision und Zielarchitektur
  • Erstellung von Domänen- und Schnittstellenmodellen
  • Entwurf von Tool-Calling-Patterns
  • Definition des Verhaltensmodells für die Kommunikation zwischen KI-Agenten
  • Integration von Grafana Tempo als Datenquelle für strukturierte und unstrukturierte Trace-Daten
  • Erstellung und Pflege technischer Dokumentationen

AWS Anthropic Claude Google A2A MCP
Python AWS
München
1 Jahr 1 Monat
2024-01 - 2025-01

Virtueller Banking-KI-Assistent für eine führende internationale Bank

LLM Integration Expert EU AI Act Solution Design AI Red Teaming ...
LLM Integration Expert

Konzeption und Architekturdesign für die technische Integration eines virtuellen Bankassistenten in die Mobile-Banking-Anwendung einer führenden international agierenden Bank. Der Fokus lag auf dem Aufbau einer skalierbaren Architektur unter Einsatz von Sprachmodellen, Avatar-Generierungsmodellen und Cloud-Technologien. Besondere Beachtung fanden dabei die bankinternen Richtlinien für KI-Anwendungen sowie die Anforderungen des EU AI Acts.


Aufgaben:
  • Definition der Zielarchitektur
  • Erstellung der Nachweisdokumentation für die Erfüllung des EU AI Acts
  • Erarbeitung von Maßnahmen für die Sicherstellung der von der Applikation ausgehenden Fairness und Transparenz
  • Herleitung von Maßnahmen für die Erhöhung der Robustheit der Applikation durch standardisierte Red-Teaming-Verfahren und passende Architekturmuster

Technologien:

  • Microsoft Azure
  • Azure OpenAI Service
  • Azure Text to Speech Avatar (TTS-Avatar)
  • Azure Speech to Text (STT)
  • OpenAI GPT-4
  • Azure AI Search
  • Cognigy AI



Azure Azure OpenAI Service Azure AI Search Cognigy AI Text-to-Speech
EU AI Act Solution Design AI Red Teaming Responsible AI Prompt Engineering
Frankfurt am Main
1 Jahr
2022-07 - 2023-06

ML-gestützte Optimierung von KYC-Prozessen in einer internationalen Bank

ML Solution Architect Python Google Cloud
ML Solution Architect

Begleitung des Go-Live von ML-Anwendungen zur Steigerung der Effizienz von KYC-(Know Your Customer)-Prozessen für eine führende international agierende Bank. Ziel des Projekts war die Optimierung bestehender Workflows sowie die Sicherstellung einer skalierbaren und regulatorisch konformen IT-Systemlandschaft. Durch die enge Verzahnung von fachlicher und technischer Unterstützung wurde eine stabile, revisionssichere und zukunftsfähige Lösung geschaffen. So konnten Compliance-Anforderungen effizient erfüllt und die Gesamtperformance der KYC-Prozesse deutlich verbessert werden.


Aufgaben:
  • Analyse der aktuellen KYC-Prozesse und Ableitung von Anforderungen für ML-Modelle und IT-Systeme.
  • Erstellung technischer Dokumentation, einschließlich Architektur- und Sequenzdiagrammen, Komponentenbeschreibungen, Datenbankschemata und Release-Notes.
  • Definition und Einhaltung regulatorischer Vorgaben wie Datenschutz, Betriebskonzepte, Testframeworks und Rollenmodelle.

  • Steuerung der Stakeholder-Kommunikation, Erstellung und Freigabe von User Stories sowie Abstimmung zwischen Fach- und Technikteams.
  • Integration KI-gestützter Entscheidungsunterstützung in bestehende Onboarding- und Monitoring-Workflows

Google Cloud Apache Spark Google BigTable Google BigQuery Qlik Automic Software FastAPI
Python Google Cloud
Frankfurt am Main

Aus- und Weiterbildung

Aus- und Weiterbildung

3 Jahre 11 Monate
2017-10 - 2021-08

Business IT

B.Sc.,
B.Sc.

Kompetenzen

Kompetenzen

Schwerpunkte

LLM Integration
Experte
AI Cloud Services
Experte
Generative AI
Experte
ML Ops
Experte
Multi-Agent-Architecture
Experte
EU AI Act
Fortgeschritten
  • Auswahl des relevanten Tech Stacks aus der Cloud (Azure / AWS)
  • Integration von LLMs in It-Landschaften
  • Regulatorik in AI (EU AI Acts)
  • Agent-to-Agent Kommunikation (A2A-Communication)

Branchen

Branchen

  • Retail Banking (Online Banking, Big Data)
  • Automotive (End-Customer, Dealer, Direct Sales)
  • Services (Steuerberatung, Kanzlei)

Vertrauen Sie auf Randstad

Im Bereich Freelancing
Im Bereich Arbeitnehmerüberlassung / Personalvermittlung

Fragen?

Rufen Sie uns an +49 89 500316-300 oder schreiben Sie uns:

Das Freelancer-Portal

Direktester geht's nicht! Ganz einfach Freelancer finden und direkt Kontakt aufnehmen.