WEBINAIRE Gérer un projet data au quotidien - 9 avril 2019 - Ayming
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
Faire parler la donnée est un art difficile (extrait du dernier numéro HBR) 4 Les cadres se plaignent du montant qu’ils investissent dans les projets data, sans en obtenir le résultat escompté. Ils n’observent pas de résultats tangibles, tout simplement parce que les résultats ne sont pas communiqués dans leur propre langage.
La data … pour quoi faire ? 6 Prédire : business as usual, en plus … • Améliorer des process existants ciblé (client le plus intéressé, le dossier (marketing, production, RH, frauduleux, …) … comptabilité, management commercial …) … Expliquer : comprendre le monde pour le changer (pourquoi un client résilie, développe plus de valeur, …) … • Fournir de nouveaux services aux … Quel clients / partenaires grâce aux objectif ? données recueillies … Des questions que tout le monde en entreprise doit se poser, localement • Mettre la donnée au centre : … vendre la donnée ou l’exploiter dans un nouveau cadre …
Comment choisir 7 Foisonnement Sélection Enjeu métier Usecase 2 Usecase 3 Usecase 1 Usecase 4 Usecase 5 Faisabilité / Disponibilité des données
Un risque de court circuit ! 8 Data • Cadrage • Feature engineering • Court circuit Décision Information Deep • learning • Machine • Optimisation • learning Connaissance Reference - Stéphane Mallat - Conférence BCG gamma à l’IFA
La data … pour quoi faire ? 3 niveaux de bénéfices 9 Leviers Résultats statistiques Exemples de résultats opérationnels Une meilleure visibilité de Reconstituer des coûts complets de gestion par gestion grâce à un accès sinistre habitation large à toutes les sources Compréhension Accès large aux données de données internes externes Un scoring de Identifier les profils de clients sur le point de (machine learning) comportement : « que va- résilier pour les retenir Modélisation t-il se passer ? » Action curative - continue Dépouillement du modèle Un diagnostic Modéliser la performance opérationnelle des agences : opérationnel poussé : en déduire les leviers locaux d’action « pourquoi cela se produit Comprendre les ressorts principaux du churn il ? » Action préventive – one shot Aucun algorithme ne dit la vérité : il est une aide à la décision pour les experts métiers
Partie 2 11 Un projet data au quotidien Webinaire | Gérer un projet data au quotidian | 09/04/2019
Enjeu de l’apprentissage supervisé : repérer des liens entre des données de contexte et une cible 12 Features / variables / … Age Sexe Revenu Dernier contact Type logement…. Achète / N’achète pas Observation 1 Interactions Cible Observation n Une corrélation ? (suffisant pour cibler) Une causalité : requis ppour agir sur le processus 12
La data est un proxy de la question business, et celle-ci n’est qu’un proxy de l’enjeu business 13 Trouver la bonne question à poser à un data scientist est aussi difficile que de choisir les questions qu’on pourrait poser à un Génie ! Espace infini de possibilités, impossibles à hiérarchiser, difficiles à formuler précisément ; Heureusement avec un data scientist vous pouvez (et même devez) tester vos questions et les adapter au fur et à mesure que vous obtenez des réponses. Ne pas confondre l’enjeu et l’indicateur « C’est juste un outil, ce n’est pas un remède contre l’inefficacité du management… la gestion par objectif fonctionne si vous connaissez vos objectifs. 90% du temps vous le les connaissez pas »
Exemple de cadrage projet amont (atelier pluridisciplinaire) : détection de résiliation 14 Enjeu : réduire le churn Quelle est la question ? Que va-t-on faire avec Veut-on identifier tous ce modèle ? les churners ? A quelle échéance veut-on les détecter ? Veut-on prévenir (rentabiliser une campagne fidélisation) ou Et si on modélisait la guérir (changer le process) ? durée de vie / LTV / .. Plutôt que le churn ? Qu’est ce qu’un churner ? (Une résiliation ou un acte de distanciation détectable en Comment conquière-t-on nos clients ? (nos amont ? ) concurrents font pareil) : un acte volontaire client ou le résultat d’un démarchage 14
La donnée analysée loin du terrain est dangereuse 15 The best data scientists have strong imaginative skills for not just “thinking outside the box” – but actually redefining the box – in trying to find variables and metrics that might be better predictors of performance. Bill Schmarzo
Des sprint agiles ? 16 L’enjeu de chaque cycle de production est d’apporter une information nouvelle utile au métier A chaque fin de cycle la question posée est challengée et souvent réajustée : sinon signal d’alerte d’un projet qui va dans le mur ! Au bout de 3 à 5 cycles la question et la réponse dont stabilisées A chaque étape le dialogue datascience métier est outillé pour favoriser la 3 - Visualisation compréhension mutuelle & Story telling 2 semaines 1 - formulation 2- problème Modélisation Structure de sprint data
Des sprint agiles A chaque étape le dialogue datascience métier est outillé pour favoriser la compréhension mutuelle 17 Intégrer progressivement les données, de sprint en sprint, commençant par les Back to the features ! données les plus naturelles et les plus accessibles jusqu’aux données les plus (plus important que le choix d’un complexes (non structurées, nouvelles sources, ..) modèle) Partir de la modélisation la plus simple (régression linéaire / logistique) et monter en Etre amoureux du problème, puissance progressivement : mesurer le gain réel d’un modèle complexe pas de la solution ! Une trajectoire d’apprentissage 3 1 2 3 3 1 2 Périmètre data 1 2 3 1 2 3 1 2 3 1 2 L’enjeu de chaque cycle de production est d’apporter une information nouvelle utile au métier Complexité des algorithmes
Un projet data est comme une enquête policière : affichez vous indices et partagez les ! 18 Créer une zone d’attraction qui incite les métiers à venir au contact des enquêteurs data même en dehors des sprint review !
Partie 3 19 Et après ? Webinaire | Gérer un projet data au quotidian | 09/04/2019
Vers une démarche active learning 20 Les données disponibles à un instant donnée dans une entreprise révèlent son SI, pas son ambition de contrôle sur son activité Les premiers tests de machine learning exploitent la donnée disponible : c’est légitime et pertinent dans une première étape L’enjeu est devient très rapidement d’organiser la collecte de données qui auront pour objectif Des données disponibles Des données collectées en fonction de besoins identifiés
Des questions ?
Nos prochains évènements 22 Les 10 & 11 avril – stand W123 Cité Internationale de Lyon Salon SIDO Accueil Terreaux - Forum 1/2/3 - 4/5/6 au 50 Quai Charles de Gaulle | Lyon 06 Le Sommet Ayming est partenaire de la 9ème édition du Sommet des Leaders de la Finance des Leaders Jeudi 11 avril 2019 au Pavillon d’Armenonville, à Paris. de la Finance
Denis OBLIN Data Scientist doblin@ayming.com Romain Jouin Data Scientist rjouin@ayming.com
Vous pouvez aussi lire