Unser Kunde sucht Sie zum nächstmöglichen Zeitpunkt!
Stellenbeschreibung
- Aufbau und kontinuierliche Weiterentwicklung einer unternehmensweiten AI-Plattform auf Basis von Kubernetes
- Deployment, Betrieb und Optimierung von Large Language Models (LLMs) auf GPU-basierten Infrastrukturen
- Entwicklung und Betrieb leistungsfähiger Model-Serving- und Inference-Services
- Etablierung, Betrieb und Weiterentwicklung von MLOps-Standards sowie einer On-Premise-MLOps-Plattform (u. a. ClearML, OpenShift)
- Konzeption und Implementierung von LLMOps-Workflows für produktive GenAI-Services (inkl. Serving-/Runtime-Konfiguration, Guardrails & Policies, Evaluierung, Regressionstests sowie Kosten- und Qualitätsmonitoring)
- Containerisierung und Deployment von AI-Services mittels Docker und Kubernetes
- Skalierung sowie Performance-Optimierung von GPU- und CPU-basierten Workloads
- Entwicklung robuster und skalierbarer AI-...