Ingénieur de Données Senior - Spécialiste GCP & Pipelines ML | Télétravail
À distance
À plein temps
Nous recherchons un Ingénieur de Données Senior expérimenté pour rejoindre une prestigieuse société de radiodiffusion allemande dans le cadre d'une mission stratégique. Dans ce rôle, vous serez responsable de l'architecture et de l'implémentation de pipelines de données sophistiqués alimentant des modèles d'apprentissage automatique, de la collaboration avec les data scientists, et du développement de microservices API REST dans un environnement cloud avancé. Cette mission commence par un engagement de 2 mois avec un fort potentiel de prolongation pour les candidats performants.
Responsabilités Principales
- Concevoir et mettre en œuvre des pipelines de données robustes pour la préparation, la mise à disposition et le versionnement des données destinées spécifiquement à l'entraînement de modèles d'apprentissage automatique.
- Fournir des conseils techniques approfondis aux Data Scientists concernant le développement de modèles d'apprentissage automatique, avec un accent particulier sur l'opérationnalisation en environnement de production.
- Architecturer et construire des microservices sophistiqués pour délivrer des modèles d'apprentissage automatique via des interfaces API REST standardisées.
- Implémenter des fonctions de surveillance complètes permettant un suivi précis des performances des modèles en production.
- Gérer le déploiement des microservices dans des environnements cloud de production, en garantissant le respect strict des normes de haute disponibilité et de fiabilité.
- Appliquer des pratiques d'infrastructure-as-code pour maintenir des environnements cloud cohérents, évolutifs et fiables.
- Collaborer efficacement avec des équipes pluridisciplinaires pour intégrer harmonieusement les solutions de données dans l'écosystème technique global.
- Documenter méticuleusement les solutions techniques et assurer un transfert de connaissances fluide aux équipes internes.
Compétences Requises
- Minimum de 5 ans d'expérience professionnelle dans des rôles d'ingénierie de données, dont au moins 3 ans dédiés aux environnements cloud.
- Expertise avérée avec les services Google Cloud Platform (GCP 2023+), particulièrement BigQuery et BigTable dans des contextes de production.
- Maîtrise approfondie de Python (3.9+), y compris une expérience significative avec PySpark pour le traitement de données à grande échelle.
- Connaissances avancées en SQL pour la manipulation et l'interrogation complexes de données volumineuses.
- Expérience pratique des technologies de conteneurisation : Docker et Kubernetes (versions récentes).
- Connaissance approfondie des pipelines CI/CD, particulièrement avec GitLab.
- Expérience confirmée avec Terraform pour les implémentations d'infrastructure-as-code robustes.
- Expérience démontrée dans la construction et le déploiement de pipelines de données utilisant Apache Airflow 2.x.
- Maîtrise de MLflow ou d'outils similaires de gestion du cycle de vie des modèles ML.
- Expérience significative dans la conception et l'implémentation d'API REST pour la mise à disposition de modèles d'apprentissage automatique.
- Historique prouvé d'implémentation de systèmes hautement disponibles de qualité production.
Atouts Supplémentaires
- Expérience dans l'industrie des médias ou de la radiodiffusion européenne.
- Connaissance approfondie des systèmes de traitement de données en temps réel.
- Familiarité avec les exigences RGPD et autres normes de gouvernance de données dans le contexte européen.
- Expérience avec des services GCP avancés comme Dataflow, Pub/Sub, ou AI Platform.
- Maîtrise des architectures de données en streaming pour applications critiques.
- Contributions notables à des projets open-source liés à l'ingénierie des données ou aux opérations ML.
- Expérience enrichissante dans le mentorat d'ingénieurs juniors et la direction technique d'équipes.
Pourquoi Rejoindre Ce Projet
Ce projet d'envergure vous offre l'opportunité exceptionnelle de travailler avec des applications d'apprentissage automatique de pointe dans un environnement majeur de radiodiffusion européenne. Vous perfectionnerez vos compétences en ingénierie cloud dans un projet à haute visibilité, collaborerez avec des professionnels d'élite en science des données, et développerez votre réseau professionnel international. Le potentiel d'engagement à long terme au-delà de la période contractuelle initiale représente une opportunité significative pour les candidats performants. Ce rôle stratégique combine profondeur technique et impact commercial tangible, offrant une expérience précieuse dans la résolution de défis d'ingénierie de données à l'échelle d'une entreprise de premier plan.