CDI / PARIS 16Réf 75016118
L'entreprise
Licorne française qui révolutionne l’avenir du e-commerce via le modèle de plateforme.
Leader dans l’édition de logiciels marketplace, l’entreprise fournit la technologie et l’écosystème partenaire nécessaire au lancement d’une marketplace, permettant ainsi à ses clients B2B et B2C d’accélérer leur croissance e-commerce en offrant plus de produits et de services.
Année de création : 2012
Effectifs 750 personnes
Localisation: Paris (16e) / Bordeaux
Poste/Missions
En tant que Senior Data Engineer au sein de l’équipe Data de l'entreprise, vos objectifs principaux seront de;
-Contribuer à l'enrichissement de la Data Platform
-Améliorer la robustesse des pipelines de production pour les applications et pour les pipelines de production de Machine Learning
Vos missions;
- Participer à la définition et à l’implémentation d’une architecture performante, robuste, scalable et aux coûts maîtrisés pour les applications ainsi que pour les pipelines de production de Machine Learning (évaluation des feature stores, refactoring de DAG Airflow)
-Accompagner les Data Scientists lors de leur mise en production (relecture de code, pair programming) et mettre en place les best practices
-Optimiser et améliorer la CI/CD de l’équipe en collaboration avec l’équipe SRE
-Assurer la montée en compétence des membres de l’équipe sur les sujets de MLOps et Data Engineering
Stack & Outils de l'entreprise;
Apache Spark, Kafka, AWS, AWS EMR, Python, Airflow, Mlflow, Tensorflow, Delta, Kubernetes, Redshift, SQL, Terraform, Ansible
Profil recherché
- Issu(e) d'une école d'ingénieurs ou équivalent, vous avez une expérience de minimum 5 ans d'expérience sur un poste similaire (Machine Learning et/ou Data);
- Vous avez mis en production avec succès des applications Big Data faisant appel à du Machine Learning, du NLP, du traitement d’images dans des projets d'envergure, à fort volume de données
- Votre maîtrisez Python, êtes un pro des frameworks data de la fondation Apache et êtes à l'aise dans un environnement AWS
-Vous maîtrisez au moins un outil d’orchestration (Airflow, Data Pipeline ou tout autre outil similaire)
- Un background dans le développement est un +
- Anglais indispensable
Les Bonus :
-Vous avez une expérience significative dans le domaine du e-commerce
-Vous avez déjà mis en place un Data Lake, Data Warehouse ou une Data Platform
-Vous avez déployé des applicatifs en environnement Kubernetes
-Vous avez mis en place des pipelines d'ingestion de données avec une approche CDC à l'aide de Debezium ou autre
-Vous maîtrisez Java/Scala
Localisé à Paris ou à Bordeaux / Full remote possible avec 2 jours de présence/mois
Python
Remote
Kubernetes
Data
Kafka
AWS
Data Engineer
Airflow
Machine Learning