CDI / 2 jrs TT / LA PLAINE ST DENISRéf 93210207
L'entreprise
Entreprise qui a pour objectif de créer un nouveau transport en commun dans les territoires qui en sont dépourvus (périurbains & ruraux); transformer la voiture en bus -
Covoiturage spontané, avec une garantie de départ dans les 5 à 10 mn pour chaque passager.
Année de création: 2014
Collaborateurs: 85
Locaux à Nantes (dev.) , Paris (data) et Lyon (produit) / remote selon les postes
Poste/Missions
Vous encadrez l’équipe Data composée de 4 statisticiens & ingénieurs.
Vos objectifs : diffuser l’intelligence métier à l’ensemble de l’entreprise et à ses clients par des outils d'analyse et de reporting, améliorer les méthodologie d'études de flux conducteur- passagers en amont des déploiements des réseaux et révolutionner le covoiturage au quotidien avec des modèles prédictifs innovants (temps d’attente, affluence, etc.).
Vos missions:
-Encadrer et motiver l’équipe aux compétences variées
-Être garant de la maintenance et de l’utilisation des bonnes pratiques de développement et du respect de la RGPD
-Faire le reporting aux équipes exploitation, marketing, produit et aux clients (les collectivités)
-Maintenir et améliorer un entrepôt de données agrégeant, transformant et combinant données de production comme données externes (INSEE) ou issues des interactions avec les utilisateurs (CRM type Zendesk, Mailchimp, etc.)
-Mobiliser des sources de données multiples pour reconstituer les flux par affectation sur le réseau routier, et en restituer des visualisations utilisables et compréhensibles par le bureau d'étude interne de l'entreprise et ses clients-
-Faire de la recherche et de l'expérimentation de fonctionnalités Produit, par des modèles prédictifs de temps d’attente, d’affluence conducteurs et passagers. (Approfondir et diversifier les approches existantes)
-Collaborer avec l’équipe technique et le Product Owner dans les choix d'algorithmes de suggestion d’itinéraire et de détection de fraude
-Piloter les travaux de recherche et développement selon les moyens et délais en accord avec la direction
Stack de l'entreprise:
Python 3 et librairies associées pandas, etc.
Reporting : Metabase
SGBD : PostgreSQL / PostGIS
Utilisations de logiciels SIG (QGIS) et librairies open-source (KeplerGL)
Gestion des traitements : AirFlow
Déploiement, intégration et orchestration : Gitlab CI, Kubernetes (avec soutien de l’équipe tech)
Profil recherché
De formation supérieure niveau Bac+5 en Statistiques,SIG, Maths appliquées ou Développement informatique;
vous justifiez de 7 ans minimum d’expérience en tant que Data Scientist ou plus généralement de valorisation de la donnée, avec une expérience d’encadrement préalable (2 ans).
-Vous maîtrisez les premiers niveaux de la pyramide Data, architecture en contexte Cloud,qualité de la donnée, transformation et analyse de données, et disposez idéalement d’une expérience en machine learning
-Vous avez idéalement travaillé avec des données géographiques, et des bases statistiques de référence
-Vous avez idéalement mis en place des outils de reporting et d’analyse interne et externe, et savez les diffuser et les maintenir dans la durée
-Connaissances de la stack utilisée par l'entreprise
2 jrs TT / semaine
Python
Kubernetes
Data
Data Engineer
Data Scientist
Airflow
Machine Learning
Lead
SIG