KS-006930
Leistungsbeschreibung
Aufgaben:
Verantwortung für den Betrieb, die Weiterentwicklung und die technische Stabilität eines KI Produkts, das mittels Machine Learning Ausfallwahrscheinlichkeiten von Mittelspannungskabeln prognostiziert. Die Rolle kombiniert Data Science, Data Engineering, MLOps und Cloud Betrieb (Databricks + Azure) und deckt damit die verschiedenen Bereiche ab, die für den Betrieb eines produktiven KI-Systems notwendig sind: Datenbeschaffung, Datenverarbeitung, Training, Deployment, Monitoring, Cloud Betrieb.
1. Betrieb & Weiterentwicklung des Produkts
- Sicherstellen eines stabilen, zuverlässigen Betriebs der ML Pipelines in Databricks
- Überwachung, Debugging und Optimierung von Jobs, Clustern und Workflows
- Weiterentwicklung der ML Modelle (Feature Engineering, Retraining, Evaluation)
- Versionierung und Deployment von Modellen über GitLab CI/CD
2. Data Engineering
- Aufbau und Pflege von Datenpipelines (ETL/ELT) in Spark
- Verarbeitung von SAP und GIS Daten
- REST API
- Modellierung und Verwaltung von Delta Tables im Unity Catalog, Nutzung von Azure Blob Storage
- Schreiben von Ergebnissen in externe SQL Datenbanken
3. MLOps & CI/CD
- Pflege und Anpassung der GitLab Pipelines für Deployment und Tests
- Monitoring von Modellqualität und Datenqualität
- Umgang mit Service Principals, Managed Identities und Secrets (Key Vault)
Anforderungen
Kompetenzen:
- Python (sehr gut)
- PySpark / Spark SQL (sehr gut)
- Erfahrung mit Databricks (Workflows, Cluster, Repos, UC, Delta Lake)
- GitLab CI/CD (Pipelines, Runner, Deployment Strategien)
- REST APIs (Requests, Auth, OpenAPI Spezifikationen)
- SQL (für Analyse + Schreiben in externe Datenbanken)
Über den Auftraggeber
!!! Hierbei handelt es sich um eine Arbeitnehmerüberlassung (ANÜ) !!!
Bitte geben Sie bei Ihrer Bewerbung Ihre Gehaltsvorstellung mit an (z.B. im Feld "Bemerkungen")
Start: ab 06.07.2026
Ende: bis 18.12.2026 + Option
Volumen: 40 Stunden je Woche
Einsatzort: Remote & Hamburg

