Ingénieur Data Lead (H/F) | IA & Médias Sociaux | 100% Télétravail

À distance
À plein temps
Temps partiel
Notre plateforme révolutionne la manière dont les créateurs de contenu interagissent avec les médias sociaux en utilisant des technologies d'intelligence artificielle avancées. Nous sommes en pleine croissance et recherchons un expert en ingénierie de données capable de bâtir et d'optimiser nos systèmes data à grande échelle. Responsabilités clés - Concevoir, développer et maintenir des pipelines de données robustes et évolutifs pour collecter, traiter et stocker des données provenant de diverses plateformes de médias sociaux et interactions utilisateurs. - Élaborer l'architecture complète de notre entrepôt de données (data warehouse) en tenant compte des exigences actuelles et futures. - Mettre en œuvre des processus rigoureux de vérification de qualité et de validation des données pour préserver l'intégrité, l'exactitude et la fiabilité des données utilisées par nos modèles d'IA. - Automatiser les processus d'extraction, transformation et chargement (ETL) pour rationaliser l'ingestion et la transformation des données, réduisant ainsi les interventions manuelles et améliorant l'efficacité opérationnelle. - Surveiller en continu et optimiser les pipelines de données pour améliorer la vitesse, la fiabilité et l'évolutivité, garantissant un fonctionnement fluide de notre Assistant IA. - Collaborer étroitement avec les Data Scientists, les ingénieurs en Machine Learning et les équipes pluridisciplinaires pour comprendre les besoins en données et fournir l'infrastructure nécessaire au développement et à l'entraînement des modèles. - Appliquer des pratiques strictes de gouvernance des données, garantissant la confidentialité, la sécurité et la conformité avec les réglementations pertinentes, notamment le RGPD, dans le contexte des données des médias sociaux. - Établir des indicateurs de performance et implémenter des solutions de surveillance pour identifier et résoudre les goulots d'étranglement ou anomalies dans le pipeline de données. - Collaborer avec les analystes de données et les équipes métier pour concevoir des tableaux de bord interactifs permettant une prise de décision basée sur les données. - Développer et maintenir des data marts et des tableaux de bord offrant des insights en temps réel sur les données des médias sociaux. - Rester à jour sur les technologies, outils et frameworks émergents dans le domaine des données, en évaluant leur potentiel pour améliorer les processus d'ingénierie de données. Compétences requises - Diplôme de niveau Bac+5 en informatique, ingénierie des données, ou domaine connexe (école d'ingénieur, master spécialisé). - Expérience confirmée de 5+ ans en ingénierie des données, avec un accent sur les processus ETL, le développement de pipelines de données et l'assurance qualité des données. - Maîtrise avancée des langages de programmation comme Python 3.9+ et SQL, ainsi que des bibliothèques et frameworks d'ingénierie de données (Apache Airflow, Apache Spark, Pandas, etc.). - Expérience approfondie avec les solutions de stockage et de traitement de données basées sur le cloud, telles qu'AWS (Redshift, S3, Glue), Azure (Synapse Analytics, Data Factory) ou Google Cloud (BigQuery, Dataflow). - Connaissance des architectures de données modernes (data lake, lakehouse, data mesh) et des technologies BigData (Hadoop, Spark). - Expérience pratique avec les outils de CI/CD et les méthodologies DevOps appliquées aux projets de données. - Maîtrise des bases de données relationnelles (PostgreSQL, MySQL) et NoSQL (MongoDB, Cassandra). - Familiarité avec les principes DataOps et les méthodologies Agiles (Scrum, Kanban). Atouts supplémentaires - Expérience dans le domaine des médias sociaux ou des plateformes de contenu. - Connaissance des API des principales plateformes de médias sociaux (Twitter, Instagram, TikTok, LinkedIn, etc.). - Compréhension des techniques de machine learning et d'intelligence artificielle. - Expérience avec les technologies de traitement de données en temps réel (Kafka, Kinesis). - Certification professionnelle en cloud computing ou en ingénierie de données. - Connaissance approfondie de la gouvernance des données et des réglementations sur la confidentialité des données. Pourquoi nous rejoindre? En rejoignant notre équipe en tant qu'Ingénieur Data Lead, vous aurez l'opportunité de façonner l'infrastructure de données d'une plateforme innovante à la pointe de l'IA et des médias sociaux. Vous travaillerez avec les dernières technologies cloud et big data dans un environnement dynamique et collaboratif. Ce poste entièrement en télétravail vous offre une flexibilité totale, accompagnée d'une rémunération compétitive et de nombreuses possibilités de développement professionnel.