WEBINAIRE Gérer un projet data au quotidien - 9 avril 2019 - Ayming

 
CONTINUER À LIRE
WEBINAIRE Gérer un projet data au quotidien - 9 avril 2019 - Ayming
WEBINAIRE

Gérer un projet data
   au quotidien
       9 avril 2019
WEBINAIRE Gérer un projet data au quotidien - 9 avril 2019 - Ayming
Intervenants
                                                 2

               Denis Oblin      Romain Jouin
               Data Scientist   Data Scientist
WEBINAIRE Gérer un projet data au quotidien - 9 avril 2019 - Ayming
Avez-vous un projet
en cours ou planifié
de valorisation des
     données ?
WEBINAIRE Gérer un projet data au quotidien - 9 avril 2019 - Ayming
Faire parler la donnée est un art difficile (extrait du dernier numéro HBR)
                                                                                                              4

 Les cadres se plaignent du montant qu’ils investissent dans les projets data, sans en obtenir le résultat
  escompté.
 Ils n’observent pas de résultats tangibles, tout simplement parce que les résultats ne sont pas
  communiqués dans leur propre langage.
WEBINAIRE Gérer un projet data au quotidien - 9 avril 2019 - Ayming
Partie 1
                                                                                5

                                                               A quoi sert
                                                             un projet Data ?

Webinaire | Gérer un projet data au quotidian | 09/04/2019
WEBINAIRE Gérer un projet data au quotidien - 9 avril 2019 - Ayming
La data … pour quoi faire ?
                                                                                                             6

                                                           Prédire : business as usual, en plus          …
                      • Améliorer des process existants    ciblé (client le plus intéressé, le dossier
                        (marketing, production, RH,        frauduleux, …)                                …
                        comptabilité, management
                        commercial …)                                                                    …
                                                           Expliquer : comprendre le monde pour
                                                           le changer (pourquoi un client résilie,
                                                           développe plus de valeur, …)                  …

                      • Fournir de nouveaux services aux   …
           Quel
                        clients / partenaires grâce aux
         objectif ?
                        données recueillies                …
                                                                            Des questions que tout le
                                                                           monde en entreprise doit se
                                                                               poser, localement

                      • Mettre la donnée au centre :       …
                        vendre la donnée ou l’exploiter
                        dans un nouveau cadre              …
WEBINAIRE Gérer un projet data au quotidien - 9 avril 2019 - Ayming
Comment choisir
                                                                        7

         Foisonnement               Sélection
                         Enjeu métier

                                           Usecase 2
                                                            Usecase 3
                             Usecase 1

                                                        Usecase 4

                                        Usecase 5

                        Faisabilité / Disponibilité des données
WEBINAIRE Gérer un projet data au quotidien - 9 avril 2019 - Ayming
Un risque de court circuit !
                                                                                                                               8

                                                              Data
                          •   Cadrage                                    •       Feature
                                                                                 engineering
                                        •   Court
                                            circuit
                       Décision                                          Information
                                                     Deep
                                                      •

                                                  learning

                                                                             •   Machine
                  •   Optimisation                                           •   learning
                                                          Connaissance

                                                                                            Reference
                                                                                            -   Stéphane Mallat
                                                                                            -   Conférence BCG gamma à l’IFA
WEBINAIRE Gérer un projet data au quotidien - 9 avril 2019 - Ayming
La data … pour quoi faire ?
 3 niveaux de bénéfices
                                                                                                                                 9

             Leviers                       Résultats statistiques        Exemples de résultats opérationnels

                                           Une meilleure visibilité de   Reconstituer des coûts complets de gestion par
                                           gestion grâce à un accès      sinistre habitation
                                           large à toutes les sources     Compréhension
                 Accès large aux données

                                           de données
                    internes externes

                                           Un scoring de                 Identifier les profils de clients sur le point de
             (machine learning)

                                           comportement : « que va-      résilier pour les retenir
                Modélisation

                                           t-il se passer ? »             Action curative - continue
          Dépouillement
            du modèle

                                           Un diagnostic                 Modéliser la performance opérationnelle des agences :
                                           opérationnel poussé :         en déduire les leviers locaux d’action
                                           « pourquoi cela se produit    Comprendre les ressorts principaux du churn
                                           il ? »                         Action préventive – one shot

                      Aucun algorithme ne dit la vérité : il est une aide à la décision pour les experts métiers
WEBINAIRE Gérer un projet data au quotidien - 9 avril 2019 - Ayming
Quel est votre
  profil ?
Partie 2
                                                                              11

                                                             Un projet data
                                                              au quotidien

Webinaire | Gérer un projet data au quotidian | 09/04/2019
Enjeu de l’apprentissage supervisé : repérer des liens entre des données de contexte et une cible
                                                                                                                             12

                           Features / variables / …
                           Age Sexe Revenu Dernier contact Type logement….                      Achète / N’achète pas

           Observation 1

                                        Interactions
                                                                                                 Cible

           Observation n

                                                       Une corrélation ? (suffisant pour cibler)
                                                       Une causalité : requis ppour agir sur le processus               12
La data est un proxy de la question business, et celle-ci n’est qu’un proxy de l’enjeu business
                                                                                                                                                        13

 Trouver la bonne question à poser à un data scientist est aussi difficile que de choisir
   les questions qu’on pourrait poser à un Génie !

     Espace infini de possibilités, impossibles à hiérarchiser, difficiles à formuler
       précisément ;

     Heureusement avec un data scientist vous pouvez (et même devez) tester vos
       questions et les adapter au fur et à mesure que vous obtenez des réponses.

                                                                                   Ne pas confondre l’enjeu et l’indicateur

                                                                                          « C’est juste un outil, ce n’est pas un remède contre
                                                                                            l’inefficacité du management… la gestion par objectif
                                                                                            fonctionne si vous connaissez vos objectifs. 90% du temps
                                                                                            vous le les connaissez pas »
Exemple de cadrage projet amont (atelier pluridisciplinaire) : détection de résiliation
                                                                                                                    14

                                              Enjeu : réduire le churn
                                              Quelle est la question ?
                                                                             Que va-t-on faire avec
             Veut-on identifier tous                                         ce modèle ?
             les churners ?                 A quelle échéance veut-on les
                                            détecter ?                        Veut-on prévenir (rentabiliser
                                                                              une campagne fidélisation) ou
                  Et si on modélisait la                                      guérir (changer le process) ?
                  durée de vie / LTV / ..
                  Plutôt que le churn ?                              Qu’est ce qu’un churner ? (Une
                                                                     résiliation ou un acte de
                                                                     distanciation détectable en
                 Comment conquière-t-on nos clients ? (nos           amont ? )
                 concurrents font pareil) : un acte volontaire
                 client ou le résultat d’un démarchage

                                                                                                               14
La donnée analysée loin du terrain est dangereuse
                                                                                                                                                          15

 The best data scientists have strong imaginative skills for not just “thinking outside the box” – but actually redefining the box – in trying to find
   variables and metrics that might be better predictors of performance.

     Bill Schmarzo
Des sprint agiles ?
                                                                                                                          16

 L’enjeu de chaque cycle de production est d’apporter une information
   nouvelle utile au métier

 A chaque fin de cycle la question posée est challengée et souvent
   réajustée : sinon signal d’alerte d’un projet qui va dans le mur !

 Au bout de 3 à 5 cycles la question et la réponse dont stabilisées

 A chaque étape le dialogue datascience métier est outillé pour favoriser la               3 - Visualisation
   compréhension mutuelle                                                                    & Story telling

                                                                                             2 semaines

                                                                                1 - formulation             2-
                                                                                   problème                Modélisation

                                                                                       Structure de sprint data
Des sprint agiles
A chaque étape le dialogue datascience métier est outillé pour favoriser la compréhension mutuelle
                                                                                                                                                     17

 Intégrer progressivement les données, de sprint en sprint, commençant par les                       Back to the features !
   données les plus naturelles et les plus accessibles jusqu’aux données les plus                     (plus important que le choix d’un
   complexes (non structurées, nouvelles sources, ..)                                                 modèle)

 Partir de la modélisation la plus simple (régression linéaire / logistique) et monter en
                                                                                                      Etre amoureux du problème,
   puissance progressivement : mesurer le gain réel d’un modèle complexe
                                                                                                      pas de la solution !

                                         Une trajectoire d’apprentissage
                                                                                              3

                                                                                          1
                                                                                                  2

                                                                                  3

                                                                      3       1
                                                                                      2
            Périmètre data

                                                                  1
                                                                          2
                                                          3

                                                      1
                                                              2

                                             3

                                         1
                                                 2

                                 3

                             1
                                     2
                                                                                                      L’enjeu de chaque cycle de production est
                                                                                                      d’apporter une information nouvelle utile au métier

                                                     Complexité des algorithmes
Un projet data est comme une enquête policière : affichez vous indices et partagez les !
                                                                                                                            18

                                                                                  Créer une zone d’attraction qui incite
                                                                                    les métiers à venir au contact des
                                                                                    enquêteurs data même en dehors des
                                                                                    sprint review !
Partie 3
                                                                          19

                                                             Et après ?

Webinaire | Gérer un projet data au quotidian | 09/04/2019
Vers une démarche active learning
                                                                                                                                     20

 Les données disponibles à un instant donnée dans une entreprise révèlent son SI, pas son ambition de contrôle sur son activité

     Les premiers tests de machine learning exploitent la donnée disponible : c’est légitime et pertinent dans une première étape

     L’enjeu est devient très rapidement d’organiser la collecte de données qui auront pour objectif
                   Des données disponibles                                          Des données collectées en fonction
                                                                                    de besoins identifiés
Des questions ?
Nos prochains évènements
                                                                                                             22

                            Les 10 & 11 avril – stand W123

                            Cité Internationale de Lyon
       Salon SIDO
                            Accueil Terreaux - Forum 1/2/3 - 4/5/6 au 50 Quai Charles de Gaulle | Lyon 06

        Le Sommet           Ayming est partenaire de la 9ème édition du Sommet des Leaders de la Finance
        des Leaders         Jeudi 11 avril 2019 au Pavillon d’Armenonville, à Paris.
       de la Finance
Denis OBLIN
  Data Scientist
doblin@ayming.com

   Romain Jouin
   Data Scientist
rjouin@ayming.com
Vous pouvez aussi lire