L'utilité du Big Data pour le ciblage Internet

La page est créée Robert Charles
 
CONTINUER À LIRE
L'utilité du Big Data pour le ciblage Internet
GENIE MATHEMATIQUE
                                                                   2014 - 2015

                                                             Philippe ECHARD - HUMANITES
                                                             Projet Sciences Humaines
                                                                     3ème année

                 Big Brother du XXIème
                        siècle
           L’utilité du Big Data pour le ciblage Internet

Hugo  Sechier,
 Big Brother duAgathe   Nevière,
               XXIème siècle        Anthony
                             : le ciblage    Laffond, Mélanie Bazoge, Marie-Cécile Riom1
                                          commercial
L'utilité du Big Data pour le ciblage Internet
Projet de Sciences Humaines – 3ème année Génie Mathématiques

Big Brother du XXIème siècle : le ciblage commercial                         2
L'utilité du Big Data pour le ciblage Internet
Projet de Sciences Humaines – 3ème année Génie Mathématiques

Table des matières

NOTE DE SYNTHESE                                                              4
Introduction                                                                  4

I. DEFINITION ET OBJECTIFS                                                     4
A) BIG DATA                                                                    4
B) LES DEUX TYPES DE CIBLAGES                                                  5
 Le reciblage publicitaire                                                    5
 Le ciblage prédictif                                                         6
II. LE PRINCIPE DU CIBLAGE PREDICTIF                                           7
DEFINITION DES ALGORITHMES/MATHEMATIQUE                                        7
III. POINTS FORTS ET REPERCUTIONS DANS LA SOCIETE                             10
A) AVANTAGES POUR LES ENTREPRISES                                             10
B) AVANTAGES POUR LES INTERNAUTES                                             11
C) UN PETIT PROBLEME DE LOIS…                                                 11
IV. EVOLUTION DU BIG DATA PAR RAPPORT AU CIBLAGE COMMERCIAL                   13
Conclusion                                                                    14

BIBLIOGRAPHIE CRITIQUE                                                        15

DIAGRAMME DE GANTT                                                            17

Big Brother du XXIème siècle : le ciblage commercial                           3
L'utilité du Big Data pour le ciblage Internet
Projet de Sciences Humaines – 3ème année Génie Mathématiques

     Note de Synthèse
     Introduction
              Vous décidez de réserver un billet d’avion pour New-York sur Internet. Deux jours
     plus tard, en lisant votre quotidien en ligne, une publicité vous propose une offre
     intéressante pour une location de voitures à New York. Ce n’est pas une simple coïncidence :
     il s’agit d’un mécanisme de publicité ciblée, comme il s’en développe actuellement de plus
     en plus sur Internet.

I.          Définition et objectifs

                 a) Big Data

           Les vagues technologiques qui se sont succédé au cours de ces trente dernières
     années ont joué un rôle déterminant dans l’amélioration des systèmes d’information.

           Une émergence des technologies mobiles : Smartphones, tablettes ainsi que l’essor
     des réseaux sociaux (Facebook, Twitter, LinkedIn). Il y a également une nouvelle
     technologie : le cloud, cette informatique « dans les nuages » permet l’utilisation de la
     mémoire, des capacités de calcul des serveurs répartis dans le monde entier.

           Tout ceci donne des informations qui sont déduites d’un ensemble de données. Les
     données sont donc des éléments porteurs d’information.

            L’explosion du volume de données expliquées par l’ensemble des nouvelles
     technologies est à l’origine du concept Big Data. Cette expression « Big Data » peut être
     définie pour un énorme volume de données structurées ou non structurées, difficilement
     gérables avec des solutions classiques de stockage et de traitement.

                Une autre caractérisation du Big Data est celle des 3V : Volume, variété et vélocité.

            Tout d’abord il y a un nombre inimaginable de données à traiter (l’unité de mesure
     est de l’ordre de l’exaoctet1). On peut regarder ce tableau pour nous faire comprendre
     l’importance de ce « volume » :

     1
         Exaoctet : Unité de mesure de quantité d’information numérique, valant 1018 octets

     Big Brother du XXIème siècle : le ciblage commercial                                               4
L'utilité du Big Data pour le ciblage Internet
Projet de Sciences Humaines – 3ème année Génie Mathématiques

       SCHEMA 1.1 : EXEMPLES DE VOLUMES DE DONNEES PRODUITES EN UNE MINUTE EN 2012

      Ensuite le second V qui fait référence à la variété des sources qui produisent les
données : tablettes, ordinateurs, smartphones, réseaux sociaux etc…

       Et enfin le dernier V représente la vitesse de prise en compte des informations
générées. Car en effet l’objectif est de canaliser et de gérer instantanément les données
pour réagir le plus vite possible, par exemple pour exploiter en temps réel les réponses au
contexte des clients.

       On comprend donc que l’usage du Big Data permet de mieux connaître ses clients.
Nous allons creuser un peu plus ce domaine là : le ciblage commercial.

        b) Les deux types de ciblages

        Comme exposé précédemment, les entreprises ont un nouvel angle d’attaque pour
mieux connaître leurs clients grâce au Big Data. Cette innovation permet de faire du ciblage
comportemental qui est une forme de publicité en ligne qui consiste à afficher des contenus
publicitaires en adéquation avec le comportement d’une personne sur internet. Il existe à ce
jour deux types de ciblage comportemental : le reciblage publicitaire et le ciblage prédictif.

            Le reciblage publicitaire
       Cette méthode est assez simple, elle consiste à analyser les recherches effectuées par
un internaute sur un site internet, pour ensuite utiliser ces données afin de diffuser des
bannières publicitaires personnalisées sur les sites que l'internaute ciblé est susceptible de
consulter par la suite. Pour comprendre cette méthode, voici un schéma :

Big Brother du XXIème siècle : le ciblage commercial                                        5
L'utilité du Big Data pour le ciblage Internet
Projet de Sciences Humaines – 3ème année Génie Mathématiques

      Un internaute consulte un site internet de voyages, puis
                  quitte ce site sans rien acheter

          Lorsqu’il va consulter un autre site internet, il sera reconnu
          grâce à un cookie déposé sur son ordinateur lors de la visite
                          du site de vente de voyages

                 En conséquence, l’internaute verra s’afficher une bannière
                 publicitaire proposant notamment les derniers séjours ou
                      hôtels consultés sur le site de vente de voyages

                        Si l’internaute clique sur cette bannière publicitaire, il sera
                            directement redirigé vers le site de vente de voyages

              SCHEMA 1.2 : RECAPITULATIF DE LA METHODE DU RECIBLAGE PUBLICITAIRE

        Cette méthode reste assez basique, mais permet tout de même aux entreprises
d’inciter les visiteurs de leur site internet à concrétiser les achats.

        Cependant cette méthode est limitée car cette technique publicitaire n’attire pas de
nouveaux clients, puisqu’elle cible uniquement les internautes qui connaissent déjà le site
internet en question et qui l’ont consulté. C’est pour cela qu’il existe une deuxième variante
au ciblage comportemental : le ciblage prédictif.

      Le ciblage prédictif
       Le ciblage prédictif consiste à étudier les données et caractéristiques
comportementales des internautes pour en tirer des profils de consommateurs en vue de
faire apparaitre sur les sites internet visités par ces derniers des bannières publicitaires
proposant des produits ou services susceptibles de répondre à leurs besoins

        Les technologies et les techniques de traitement des données massives permettent
de stocker en temps réel toutes les informations structurées ou non provenant de multiples
sources, de les croiser, de les enrichir très rapidement avec un seul but : mieux connaître et
comprendre la réalité et anticiper les besoins futurs du client. C’est un des principaux
intérêts du Big Data : se projeter vers l’avenir de façon fiable (avoir une intuition quasi sûre).
Le ciblage prédictif se base là-dessus, les variables connues des modèles mathématiques,
dites explicatives, vont être utilisées pour déterminer des variables inconnues, dites à
expliquer. Ces modèles mathématiques sont utilisés pour anticiper par exemple ici l’achat
d’un produit du client.

Big Brother du XXIème siècle : le ciblage commercial                                            6
Projet de Sciences Humaines – 3ème année Génie Mathématiques

             L’objectif ultime du ciblage publicitaire est d’adresser le bon message à la bonne
      personne au bon moment. Toute la subtilité se trouve là. Nous allons donc consacrer ce
      dossier à cette méthode, le ciblage prédictif, qui est beaucoup plus complexe que le
      reciblage publicitaire.

II.      Le principe du ciblage prédictif

              Définition des algorithmes/mathématique

             La « recette » du ciblage prédictif est quelque chose de très précieux pour les
      entreprises spécialisées dans ce domaine. C'est pourquoi nous n'avons pas pu obtenir de
      méthodes précises concernant ce ciblage. Cependant la société basée en Allemagne Nugg.ad
      a accepté de répondre à nos questions (qui ne posaient pas de soucis de confidentialité).
      Nous allons donc expliquer à travers Nugg.ad comment fonctionne le ciblage publicitaire
      prédictif.

            Nugg.ad est le leader Européen de l'audience et du ciblage. C'est une entreprise
      allemande, créée en 2006, dont 5 employés commerciaux sont en France. Les clients de
      Nugg.ad sont des éditeurs de sites comme TF1, le Figaro, l'Equipe …

              Nugg.ad est spécialisée dans le ciblage comportemental prédictif, elle essaye
      d'établir le profil de chaque internaute afin d'optimiser l'utilisation des impressions («
      nombre d'apparitions »), de publicités sur les sites de ces clients. Ces sites pourront vendre
      plus cher leurs impressions grâce à une meilleure efficacité.

             Pour ce faire, Nugg.ad croise deux sources de données (ce qui est un de ses
      principaux atouts sur le marché) :

             les cookies (données déclaratives)
             des sondages (c'est là où se situe la différence), effectués sur des échantillons
              représentatifs de la population des internautes (200 à 300 personnes est un bon
              effectif de sondés)

             Les données récoltées ont été préalablement « anonymisées » par un tiers : il n'y a
      pas d'adresse IP, ni aucune information permettant de retrouver un internaute dans les
      données que Nugg.ad utilise. De plus pour des raisons de coût, ces données ne sont pas
      stockées donc plus de sûreté pour les internautes.

              Ensuite, Nugg.ad croise les 2 sources de données. Par des méthodes statistiques, ils
      établissent le profil de l'utilisateur. Ils utilisent des algorithmes d'apprentissage
      automatiques (« machine learning » en anglais) et plus précisément d'apprentissage
      supervisé. Ce sont des algorithmes permettant de définir un modèle prédictif des données.

      Big Brother du XXIème siècle : le ciblage commercial                                        7
Projet de Sciences Humaines – 3ème année Génie Mathématiques

Ces modèles sont construits avec les différents types (« cluster ») d'utilisateurs, selon leur
comportement de navigation. Pour résumer, dans notre cas, cette méthode définira, à partir
des informations que l'on a pour chaque internaute, son profil.

        Il y a bien évidemment des variables qui vont plus contribuer que d'autres. Les
variables explicatives les plus discriminantes dépendent et varient d'un client à un autre,
d'un pays à l'autre, etc. Nugg.ad délivre un profil qui peut aller jusqu'à 70 variables
standards, comportant les données sociodémographiques mais aussi les centres d’intérêts,
les préférences d'achat et autres.

        Pour mesurer la qualité de chacun de ses modèles, Nugg.ad utilise la validation
croisée. C'est une méthode d’estimation de fiabilité d’un modèle fondée sur une technique
d’échantillonnage. Il existe plusieurs méthodes, mais le principe reste à peu près le même :
avant de faire le modèle une petite partie des données est retirée, on créée notre modèle à
partir des données restantes puis une fois le modèle élaboré, on le teste sur les données que
l'on avait retirées. Ils sont donc capable de déterminer la qualité de toutes leurs variables de
prédiction avant même d'utiliser les modèles et donc modifier ce modèle si besoin est.

        Nugg.ad peut croiser les données de différents sites selon les détails contractuels de
chaque client. Par défaut, Nugg.ad stocke et traite les données dans des silos2 pour chaque
client.

       Voici quelques exemples de méthodes d'apprentissage automatiques que Nugg.ad
pourraient utiliser :

       Arbres de décision boostés et agrégés
       Analyse discriminante
       Classification des k plus proches voisins
       Classifieur bayésien naïf

        Un problème survient alors : 48% d'ordinateurs sont partagés en France. Il y a donc
obligation de traiter les données en temps réel pour cibler la personnalité de l'utilisateur
actuel. Le traitement des informations se fait quasi-instantanément, souvent en moins d'une
seconde.

2
 En informatique, un silo est un dispositif fournissant ou recevant de l'information, ce peut être soit un
périphérique soit un fichier

Big Brother du XXIème siècle : le ciblage commercial                                                    8
Projet de Sciences Humaines – 3ème année Génie Mathématiques

        L'indicateur utilisé généralement pour calculer la réussite d'un ciblage est le « clic ».
Cependant c'est bien souvent un mauvais indicateur. Nugg.ad utilise d'autres indicateurs
qu'ils jugent plus pertinents comme l'évolution du nombre d'achats, l'évolution de la
notoriété du client suite au ciblage, etc.

                            SCHEMA 3.1 : RECAPITULATIF DU PROCEDE NUGG.AD

        Certains sites ont plus tendance à créer des cookies que d’autres. C’est notamment le
cas des réseaux sociaux comme Facebook qui a récemment mis à jour sa politique sur la
confidentialité des données afin de rendre « plus claire » l'utilisation des données des
utilisateurs. Il est désormais possible de choisir quelles sociétés sont autorisées à utiliser nos
cookies3. Nous pouvons tout de même choisir de ne pas diffuser nos cookies mais les
publicités qui apparaîtront ne seront pas ciblées.

       Il est clair, et Facebook ne s'en cache pas, qu'ils utilisent les données pour le ciblage
prédictif. Au mois d'octobre 2014, Facebook a mis sur le net une vidéo expliquant comment
diffuser une pub sur leur site à partir d’une page 4.

       Il suffit à un commerçant, entrepreneur ou autres de saisir quelle population il
souhaite toucher ainsi que les centres d’intérêts qui correspondre à ces individus. Comme
Facebook ne passe pas par un autre site pour générer ses pubs, il utilise ses propres
données. C’est beaucoup plus simple car tous les utilisateurs de ce réseau social ont

3
    Lien de la page permettant de gérer les cookies sur Facebook : http://www.youronlinechoices.com
4
    Lien de la vidéo explicative pour créer des publicité : https://www.youtube.com/watch?v=JXX9eAneBno

Big Brother du XXIème siècle : le ciblage commercial                                                      9
Projet de Sciences Humaines – 3ème année Génie Mathématiques

       renseigné, à leur inscription, leur date de naissance et leurs centres d’intérêt. Il ne reste plus
       qu’à retrouver dans leur base de données les personnes correspondant au ciblage souhaité
       par l’annonceur et elle apparaitra sur le fil d’actualité de ses personnes, précédé de la
       mention « sponsorisé ».

              Facebook utilise probablement une méthode différente de celle de Nugg.ad, mais le
       principe est le même.

III.      Points forts et répercutions dans la société

                a) Avantages pour les entreprises

             La publicité en ligne comprend de nombreux avantages pour les professionnels ayant
       un produit à vendre ou une marque à faire connaître. En effet, grâce à Internet, les
       entreprises peuvent cibler les clients qui les intéressent le plus. Par exemple, les marques
       vendant des produits pour les nouveaux nés vont plutôt cibler les jeunes parents. Les
       entreprises gagneront du temps en ciblant uniquement les clients concernés par leurs offres
       et cela augmentera aussi leurs bénéfices.
               Le ciblage comportemental prédictif permet de créer des cibles sur-mesure. Le
       nombre de cibles est illimité et ce ciblage a lieu en temps réel. Aussi, les publicités proposées
       sont adaptées au profil fiable de l’internaute, cela augmente les chances d’achat pour les
       entreprises et donc l’augmentation des bénéfices.

            On peut savoir rapidement l’impact d’une campagne publicitaire et ainsi en déduire
       des analyses de performance des différentes campagnes. On peut en mesurer le succès
       contrairement aux autres formes de publicité. Le retour est quasiment instantané pour les
       entreprises qui peuvent se positionner sur l’intérêt suscité de leurs produits. Ainsi, elles
       pourront mettre en valeur un produit qui a plus de succès que les autres afin d’attirer le
       maximum de personnes sur leur site Internet toujours selon le profil des internautes.

             La publicité est également diffusée beaucoup plus rapidement par ce canal que par les
       autres canaux plus classiques comme le courrier ou le démarchage. C’est un gain de temps
       pour les entreprises mais aussi un gain de stockage des plaquettes publicitaires qui se
       réduisent au détriment de la publicité en ligne.

            Enfin, à l’heure où l’écologie est un enjeu du 21 ème siècle, ces publicités en ligne
       engendrent une réduction des impressions papiers. Cela diminue donc une petite partie des
       déchets ménagers qui ont un impact sur l’environnement.

       Big Brother du XXIème siècle : le ciblage commercial                                            10
Projet de Sciences Humaines – 3ème année Génie Mathématiques

           b) Avantages pour les internautes

      La publicité en ligne comprend aussi quelques avantages pour les internautes voulant
acheter un produit en particulier. En effet, on peut acheter plus rapidement et plus
facilement en cliquant simplement sur la bannière publicitaire proposée.

       La publicité prédictive se base souvent sur les dernières pages Internet consultées.
Ainsi, les annonces seront plus pertinentes et utiles pour les consommateurs puisqu’elles
sont ciblées selon les préférences des internautes et leurs habitudes d’achats.

           c) Un petit problème de lois…

       Même si le site Nugg.ad rendent anonyme toutes les données qu’ils reçoivent et ne les
stockent pas, ce n’est pas la majorité des sites de publicités en ligne. Il est difficile de savoir
si les données sont anonymes ou non. En effet, la plupart des sites Internet utilisent un
identifiant. Dans ce cas, les données sont considérées comme étant anonymes. Cependant,
avec un identifiant et beaucoup de données concernant une personne en particulier, il peut
s’avérer très facile de retrouver la trace de l’internaute en question (sexe, localisation, ses
goûts, ses préférences, son âge, …). De ce fait, peut-on considérer que les données
collectées sont anonymes si l’on peut retrouver l’identité de l’internaute ?

        Il existe la loi « Informatique et libertés » du 6 janvier 1978 qui s’applique aux
données personnelles collectées (adresse IP, les goûts et les comportements des
internautes, …). En effet, l’internaute doit être informé quant à l’utilisation de ses données
personnelles, sur la durée de conservation de ses données, sur les traitements utilisés qui
doivent être sécurisés. Il a aussi le droit de s’opposer à ce que ses données soient utilisées.
L’application de cette loi est exigée par l’ensemble des CNIL européennes. Cependant, pour
les données issues du ciblage commercial, cette loi n’est pas obligée d’être appliquée. Ce qui
pose un réel problème de confidentialité et de respect de la vie privée des internautes. En
effet, ceci peut être considéré comme une introduction dans la vie privée des internautes et
ceci est contraire à l’article 9 du code civil5. Le non-respect de cet article peut entraîner
séquestre, saisie et autres, c’est au juge d’apprécier la sanction selon la gravité de
l’intrusion.

5Article 9 du code civil : Chacun a droit au respect de sa vie privée.
Les juges peuvent, sans préjudice de la réparation du dommage subi, prescrire toutes mesures, telles que séquestre, saisie
et autres, propres à empêcher ou faire cesser une atteinte à l'intimité de la vie privée : ces mesures peuvent, s'il y a
urgence, être ordonnées en référé. (Source : legifrance.fr)

Big Brother du XXIème siècle : le ciblage commercial                                                                  11
Projet de Sciences Humaines – 3ème année Génie Mathématiques

        Un second problème juridique du ciblage comportemental est la classification des
internautes en catégorie. Cela peut être vu comme une forme de discrimination fondée. Par
exemple, les informations collectées permettent de sélectionner des personnes recevant
une offre d’emploi en fonction de leurs orientations sexuelles, de leur couleur de peau ou
encore de leurs opinions politiques. Enfin, les sites peuvent moduler leurs prix de vente en
fonction du profil bancaire de l’internaute. Toutes ces formes de discriminations indirectes
(citées dans l’article 225-16 du code pénal) sont punies par la loi (article 225-27 du code
pénal).
        Une entreprise opérant ce genre de discrimination est passible de 3 ans
d’emprisonnement et de 45 000€ d’amende.

       De plus, il y a un nouveau règlement européen qui sera mis en place et qui limitera
les profils réalisés. Ainsi, aucune donnée privée (adresse IP comprise) ne pourra être
récoltée et les données publiques devront être anonymes. Ainsi, si un hacker prend le
contrôle du système, il ne pourra récupérer aucune donnée personnelle. Enfin, il existe des
labels comme EuroPriSe qui certifie que les données peuvent être utilisées tout en
protégeant la vie privée des personnes concernées. Il certifie donc la protection des données
personnelles. Nugg.ad est la seule entreprise européenne dans le ciblage comportemental
prédictif à avoir ce label.

        On peut en conclure que la publicité en ligne n’est pas sans danger pour les
internautes ainsi que pour les entreprises collectant les données et réalisant des profils. En
effet, selon les différentes accusations, une entreprise peut être passible d’emprisonnement
et d’amende allant jusqu’à 45 000€. Enfin, pour l’internaute, c’est le non-respect de sa vie
privée qui est en cause dans ce type de publicité.

6 Article 225-1 du code pénal : Constitue une discrimination toute distinction opérée entre les personnes physiques à raison
de leur origine, de leur sexe, de leur situation de famille, de leur grossesse, de leur apparence physique, de leur patronyme,
de leur lieu de résidence, de leur état de santé, de leur handicap, de leurs caractéristiques génétiques, de leurs moeurs, de
leur orientation ou identité sexuelle, de leur âge, de leurs opinions politiques, de leurs activités syndicales, de leur
appartenance ou de leur non-appartenance, vraie ou supposée, à une ethnie, une nation, une race ou une religion
déterminée.
Constitue également une discrimination toute distinction opérée entre les personnes morales à raison de l'origine, du sexe,
de la situation de famille, de l'apparence physique, du patronyme, du lieu de résidence, de l'état de santé, du handicap, des
caractéristiques génétiques, des moeurs, de l'orientation ou identité sexuelle, de l'âge, des opinions politiques, des activités
syndicales, de l'appartenance ou de la non-appartenance, vraie ou supposée, à une ethnie, une nation, une race ou une
religion déterminée des membres ou de certains membres de ces personnes morales. (Source : legifrance.fr)

7 Article 225-2 du code pénal : La discrimination définie aux articles 225-1 et 225-1-1, commise à l'égard d'une personne
physique ou morale, est punie de trois ans d'emprisonnement et de 45 000 euros d'amende sous certaines conditions.
(Source : legifrance.fr)

Big Brother du XXIème siècle : le ciblage commercial                                                                        12
Projet de Sciences Humaines – 3ème année Génie Mathématiques

IV.      Evolution du Big Data par rapport au ciblage commercial
            Nous avons vu comment les publicitaires utilisaient nos cookies pour arriver à cibler
      au mieux les publicités en fonction des utilisateurs derrière leurs écrans.

               Il faut d’abord savoir que seuls 20% des cookies générés sont utilisés par les sites
      internet et qu’actuellement un certain nombre d’entreprises travaillent à optimiser
      l’utilisation tous les cookies générés. Ils obtiendraient ainsi des profils encore plus réels et
      cerneraient quasiment parfaitement les internautes et leurs besoins.

             En plus des cookies, il y a aussi des fichiers log Web créés lors d’une visite sur un site
      internet. Ces fichiers sont consultables du côté des gestionnaires du site. Ils contiennent de
      nombreuses informations en relation avec le site visité comme l’adresse IP, le nombre de
      connexions sur le site, le navigateur utilisé… Ces fichiers sont très peu exploités comparés
      aux cookies, car ils sont liés au site consulté.

             Si on ajoute ces fichiers Log Web aux cookies pas encore exploités, le ciblage prédictif
      se développera encore dans les années à venir pour obtenir un ciblage publicitaire encore
      plus optimisé.

      Big Brother du XXIème siècle : le ciblage commercial                                          13
Projet de Sciences Humaines – 3ème année Génie Mathématiques

Conclusion
         Par le biais de cette synthèse, nous avons pu appréhender une utilisation spécifique
du Big Data parmi une multitude d’autres : celle du ciblage commercial. Nous avons
également vu la complexité des moyens mis en œuvre pour réussir à cibler la bonne
publicité à la bonne personne, venant de l’explosion des données sur internet. Toutefois,
l’utilisation de ces données nécessite de faire attention à la légalité due à l’exploitation de
données personnelles. Cependant, Internet évolue de jour en jour et il reste encore de
nombreuses ressources inexploitées.

Big Brother du XXIème siècle : le ciblage commercial                                          14
Projet de Sciences Humaines – 3ème année Génie Mathématiques

Bibliographie critique
I – Définition et objectifs

WIKIPEDIA, 2014. Ciblage comportemental [en ligne]. S.l. : s.n. [Consulté le 13 novembre 2014].
Disponible à l’adresse :
http://fr.wikipedia.org/w/index.php?title=Ciblage_comportemental&oldid=105806228.
     Le ciblage comportemental est une technique de Ciblage qui consiste à personnaliser les
         contenus (articles textuels, produits, publicités), en fonction du comportement des
         internautes et de l'identification de leurs centres d'intérêt.

BRASSEUR, Christophe, [sans date]. Enjeux et usages du Big Data : Technologies, méthodes et mise
en oeuvre. Lavoisier. S.l. : s.n. [Consulté le 8 janvier 2015]. Management et Informatique.
     Ce livre permet une approche du big data pour comprendre comment on utilise ceci pour le
       ciblage commercial.

II – Le principe du ciblage prédictif

ANON., [sans date]. Publicite_Ciblee_rapport_VD.pdf. S.l. : s.n.
    Rapport de la CNIL réalisé en 2009 sur la publicité ciblé en ligne (technologie de traçage -
       constitution des profils prédictifs - les exemples de publicités en ligne - les menaces - les
       enjeux pour les autorités de protection des données). Ce rapport a été utilisé pour construire
       plusieurs parties du dossier et pas uniquement celle sur le principe du ciblage prédictif.

ANON., [sans date]. nugg.ad Predictive Behavioral Targeting - nugg.ad. In : [en ligne].
[Consulté le 11 décembre 2014 i]. Disponible à l’adresse : http://www.nugg.ad/fr/.
     Site Internet d’une société de ciblage prédictif. Nous nous sommes servis de leurs études de
        cas afin de compléter notre dossier. Nous avons également contacté des membres de
        l’équipe afin de comprendre les méthodes mathématiques utilisées dans leurs algorithmes
        de ciblage prédictif.

ANON., [sans date]. Criteo. In : [en ligne]. [Consulté le 11 décembre 2014 d]. Disponible à l’adresse :
http://www.criteo.com/fr/.
     Site Internet d’une société de ciblage. Nous avons tenté de comprendre via leur site Internet
        comment fonctionnait cette société afin de cibler au mieux les internautes.

III – Points forts et répercutions dans la société

ANON., [sans date]. Accueil | Légifrance, le service public de l’accès au droit - Accueil. In : [en ligne].
[Consulté le 18 décembre 2014 a]. Disponible à l’adresse : http://www.legifrance.gouv.fr/.
     Site Internet expliquant les différentes lois françaises et les sanctions encourues en cas de
        non-respect de cette dernière : utile pour la partie concernant les problèmes de loi afin de
        voir les sanctions dont étaient passibles les entreprises de ciblages.

Big Brother du XXIème siècle : le ciblage commercial                                                      15
Projet de Sciences Humaines – 3ème année Génie Mathématiques

BEM, Anthony, [sans date]. Ciblage des clients sur internet par les annonceurs et les publicités: une
atteinte à la vie privée? In : [en ligne]. [Consulté le 11 décembre 2014]. Disponible à l’adresse :
http://www.legavox.fr/blog/maitre-anthony-bem/ciblage-clients-internet-annonceurs-publicites-
14530.htm#.VIlorqOqLDw.
     Le ciblage des clients sur Internet du point du vue législatif. Les problèmes rencontrés et le
        non-respect de certaines lois sont détaillés dans cet article écrit par un avocat.

ANON., [sans date]. Retargeting - Le reciblage publicitaire pour e-commerçants. In : [en ligne].
[Consulté le 13 novembre 2014 k]. Disponible à l’adresse :
http://www.commentcamarche.net/faq/20889-retargeting-le-reciblage-publicitaire-pour-e-
commercants.
     Explication des avantages et des inconvénients du ciblage publicitaire pour les entreprises et
        pour les internautes

ANON., [sans date]. Marketing ciblé sur internet : vos données ont de la valeur - CNIL - Commission
nationale de l’informatique et des libertés. In : [en ligne]. [Consulté le 18 décembre 2014 h].
Disponible à l’adresse : http://www.cnil.fr/les-themes/internet-telephonie/fiche-
pratique/article/marketing-cible-sur-internet-vos-donnees-ont-de-la-valeur/.
     Rapport de la CNIL explicitant les différents problèmes liés à l'utilisation des données en ligne

ANON., [sans date]. Le ciblage comportemental: quelles applications?? Quelles limites?? - Leaders
League. In : [en ligne]. [Consulté le 13 novembre 2014 g]. Disponible à l’adresse :
http://www.leadersleague.com/news/view/id/ca30c126912b75fcd80d3c78af1dd199.
     Ce site développe l'utilisation du big data ainsi que les règlementations appliquées à l'usage
        de ce dernier.

IV – Evolution du Big data par rapport au ciblage commercial
Doru Tanasa, Brigitte Trousse [2004]. Data Mining Cours. S.l. : s.n.
    Ce pdf est un cours de l’INRIA présentant les fichiers log Web et leur utilisation dans le Data
       Mining.

Big Brother du XXIème siècle : le ciblage commercial                                                16
Projet de Sciences Humaines – 3ème année Génie Mathématiques

Diagramme de Gantt

Big Brother du XXIème siècle : le ciblage commercial                         17
En 2008, le nombre d’objets connectés a dépassé le nombre d’humains, ce qui a eu pour
effet de multiplier la quantité de données. L’expression utilisée pour ces données est le « Big
Data » désignant à la fois la gestion puis l’analyse de ces énormes volumes de données générées
notamment par les utilisateurs d’Internet.

       Dans cette étude, nous exposons tout d’abord les principes du Big Data et ses applications
dans le ciblage commercial. Nous nous sommes focalisé sur le ciblage prédictif, ses points forts et
ses répercussions dans notre société.

       En effet, le ciblage prédictif utilise des données personnelles ce qui cause certains
problèmes de lois. Cependant cette méthode s’avère très efficaces pour les entreprises.
L’explosion exponentielle des données rend les techniques de Big Data nécessaires de nos jours.

Mots-clés : Big Data – Ciblage commercial – Ciblage prédictif

                                               ---------

       In 2008, the number of connected objects exceeded the number of humans in the world,
multiplying the amount of data. The term used for this data is “Big Data”,referring both to the
management and analysis of those huge volumes of data generated especially by web users.

In this study, the principles of Big Data and its applications in commercial targeting will be
developed, focusing first on predictive targeting, its strengths and its impact in our society.

Actually, predictive targeting uses personal data, which raises legal problems. However, this
method is very effective for companies. The exponential explosion of data makes the use of Big
Data techniques necessary nowadays.

Keywords : Big Data – Commercial targeting – Predictive targeting

    Big Brother du XXIème siècle : le ciblage commercial                                       18
Vous pouvez aussi lire