L'utilité du Big Data pour le ciblage Internet
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
GENIE MATHEMATIQUE 2014 - 2015 Philippe ECHARD - HUMANITES Projet Sciences Humaines 3ème année Big Brother du XXIème siècle L’utilité du Big Data pour le ciblage Internet Hugo Sechier, Big Brother duAgathe Nevière, XXIème siècle Anthony : le ciblage Laffond, Mélanie Bazoge, Marie-Cécile Riom1 commercial
Projet de Sciences Humaines – 3ème année Génie Mathématiques Big Brother du XXIème siècle : le ciblage commercial 2
Projet de Sciences Humaines – 3ème année Génie Mathématiques Table des matières NOTE DE SYNTHESE 4 Introduction 4 I. DEFINITION ET OBJECTIFS 4 A) BIG DATA 4 B) LES DEUX TYPES DE CIBLAGES 5 Le reciblage publicitaire 5 Le ciblage prédictif 6 II. LE PRINCIPE DU CIBLAGE PREDICTIF 7 DEFINITION DES ALGORITHMES/MATHEMATIQUE 7 III. POINTS FORTS ET REPERCUTIONS DANS LA SOCIETE 10 A) AVANTAGES POUR LES ENTREPRISES 10 B) AVANTAGES POUR LES INTERNAUTES 11 C) UN PETIT PROBLEME DE LOIS… 11 IV. EVOLUTION DU BIG DATA PAR RAPPORT AU CIBLAGE COMMERCIAL 13 Conclusion 14 BIBLIOGRAPHIE CRITIQUE 15 DIAGRAMME DE GANTT 17 Big Brother du XXIème siècle : le ciblage commercial 3
Projet de Sciences Humaines – 3ème année Génie Mathématiques Note de Synthèse Introduction Vous décidez de réserver un billet d’avion pour New-York sur Internet. Deux jours plus tard, en lisant votre quotidien en ligne, une publicité vous propose une offre intéressante pour une location de voitures à New York. Ce n’est pas une simple coïncidence : il s’agit d’un mécanisme de publicité ciblée, comme il s’en développe actuellement de plus en plus sur Internet. I. Définition et objectifs a) Big Data Les vagues technologiques qui se sont succédé au cours de ces trente dernières années ont joué un rôle déterminant dans l’amélioration des systèmes d’information. Une émergence des technologies mobiles : Smartphones, tablettes ainsi que l’essor des réseaux sociaux (Facebook, Twitter, LinkedIn). Il y a également une nouvelle technologie : le cloud, cette informatique « dans les nuages » permet l’utilisation de la mémoire, des capacités de calcul des serveurs répartis dans le monde entier. Tout ceci donne des informations qui sont déduites d’un ensemble de données. Les données sont donc des éléments porteurs d’information. L’explosion du volume de données expliquées par l’ensemble des nouvelles technologies est à l’origine du concept Big Data. Cette expression « Big Data » peut être définie pour un énorme volume de données structurées ou non structurées, difficilement gérables avec des solutions classiques de stockage et de traitement. Une autre caractérisation du Big Data est celle des 3V : Volume, variété et vélocité. Tout d’abord il y a un nombre inimaginable de données à traiter (l’unité de mesure est de l’ordre de l’exaoctet1). On peut regarder ce tableau pour nous faire comprendre l’importance de ce « volume » : 1 Exaoctet : Unité de mesure de quantité d’information numérique, valant 1018 octets Big Brother du XXIème siècle : le ciblage commercial 4
Projet de Sciences Humaines – 3ème année Génie Mathématiques SCHEMA 1.1 : EXEMPLES DE VOLUMES DE DONNEES PRODUITES EN UNE MINUTE EN 2012 Ensuite le second V qui fait référence à la variété des sources qui produisent les données : tablettes, ordinateurs, smartphones, réseaux sociaux etc… Et enfin le dernier V représente la vitesse de prise en compte des informations générées. Car en effet l’objectif est de canaliser et de gérer instantanément les données pour réagir le plus vite possible, par exemple pour exploiter en temps réel les réponses au contexte des clients. On comprend donc que l’usage du Big Data permet de mieux connaître ses clients. Nous allons creuser un peu plus ce domaine là : le ciblage commercial. b) Les deux types de ciblages Comme exposé précédemment, les entreprises ont un nouvel angle d’attaque pour mieux connaître leurs clients grâce au Big Data. Cette innovation permet de faire du ciblage comportemental qui est une forme de publicité en ligne qui consiste à afficher des contenus publicitaires en adéquation avec le comportement d’une personne sur internet. Il existe à ce jour deux types de ciblage comportemental : le reciblage publicitaire et le ciblage prédictif. Le reciblage publicitaire Cette méthode est assez simple, elle consiste à analyser les recherches effectuées par un internaute sur un site internet, pour ensuite utiliser ces données afin de diffuser des bannières publicitaires personnalisées sur les sites que l'internaute ciblé est susceptible de consulter par la suite. Pour comprendre cette méthode, voici un schéma : Big Brother du XXIème siècle : le ciblage commercial 5
Projet de Sciences Humaines – 3ème année Génie Mathématiques Un internaute consulte un site internet de voyages, puis quitte ce site sans rien acheter Lorsqu’il va consulter un autre site internet, il sera reconnu grâce à un cookie déposé sur son ordinateur lors de la visite du site de vente de voyages En conséquence, l’internaute verra s’afficher une bannière publicitaire proposant notamment les derniers séjours ou hôtels consultés sur le site de vente de voyages Si l’internaute clique sur cette bannière publicitaire, il sera directement redirigé vers le site de vente de voyages SCHEMA 1.2 : RECAPITULATIF DE LA METHODE DU RECIBLAGE PUBLICITAIRE Cette méthode reste assez basique, mais permet tout de même aux entreprises d’inciter les visiteurs de leur site internet à concrétiser les achats. Cependant cette méthode est limitée car cette technique publicitaire n’attire pas de nouveaux clients, puisqu’elle cible uniquement les internautes qui connaissent déjà le site internet en question et qui l’ont consulté. C’est pour cela qu’il existe une deuxième variante au ciblage comportemental : le ciblage prédictif. Le ciblage prédictif Le ciblage prédictif consiste à étudier les données et caractéristiques comportementales des internautes pour en tirer des profils de consommateurs en vue de faire apparaitre sur les sites internet visités par ces derniers des bannières publicitaires proposant des produits ou services susceptibles de répondre à leurs besoins Les technologies et les techniques de traitement des données massives permettent de stocker en temps réel toutes les informations structurées ou non provenant de multiples sources, de les croiser, de les enrichir très rapidement avec un seul but : mieux connaître et comprendre la réalité et anticiper les besoins futurs du client. C’est un des principaux intérêts du Big Data : se projeter vers l’avenir de façon fiable (avoir une intuition quasi sûre). Le ciblage prédictif se base là-dessus, les variables connues des modèles mathématiques, dites explicatives, vont être utilisées pour déterminer des variables inconnues, dites à expliquer. Ces modèles mathématiques sont utilisés pour anticiper par exemple ici l’achat d’un produit du client. Big Brother du XXIème siècle : le ciblage commercial 6
Projet de Sciences Humaines – 3ème année Génie Mathématiques L’objectif ultime du ciblage publicitaire est d’adresser le bon message à la bonne personne au bon moment. Toute la subtilité se trouve là. Nous allons donc consacrer ce dossier à cette méthode, le ciblage prédictif, qui est beaucoup plus complexe que le reciblage publicitaire. II. Le principe du ciblage prédictif Définition des algorithmes/mathématique La « recette » du ciblage prédictif est quelque chose de très précieux pour les entreprises spécialisées dans ce domaine. C'est pourquoi nous n'avons pas pu obtenir de méthodes précises concernant ce ciblage. Cependant la société basée en Allemagne Nugg.ad a accepté de répondre à nos questions (qui ne posaient pas de soucis de confidentialité). Nous allons donc expliquer à travers Nugg.ad comment fonctionne le ciblage publicitaire prédictif. Nugg.ad est le leader Européen de l'audience et du ciblage. C'est une entreprise allemande, créée en 2006, dont 5 employés commerciaux sont en France. Les clients de Nugg.ad sont des éditeurs de sites comme TF1, le Figaro, l'Equipe … Nugg.ad est spécialisée dans le ciblage comportemental prédictif, elle essaye d'établir le profil de chaque internaute afin d'optimiser l'utilisation des impressions (« nombre d'apparitions »), de publicités sur les sites de ces clients. Ces sites pourront vendre plus cher leurs impressions grâce à une meilleure efficacité. Pour ce faire, Nugg.ad croise deux sources de données (ce qui est un de ses principaux atouts sur le marché) : les cookies (données déclaratives) des sondages (c'est là où se situe la différence), effectués sur des échantillons représentatifs de la population des internautes (200 à 300 personnes est un bon effectif de sondés) Les données récoltées ont été préalablement « anonymisées » par un tiers : il n'y a pas d'adresse IP, ni aucune information permettant de retrouver un internaute dans les données que Nugg.ad utilise. De plus pour des raisons de coût, ces données ne sont pas stockées donc plus de sûreté pour les internautes. Ensuite, Nugg.ad croise les 2 sources de données. Par des méthodes statistiques, ils établissent le profil de l'utilisateur. Ils utilisent des algorithmes d'apprentissage automatiques (« machine learning » en anglais) et plus précisément d'apprentissage supervisé. Ce sont des algorithmes permettant de définir un modèle prédictif des données. Big Brother du XXIème siècle : le ciblage commercial 7
Projet de Sciences Humaines – 3ème année Génie Mathématiques Ces modèles sont construits avec les différents types (« cluster ») d'utilisateurs, selon leur comportement de navigation. Pour résumer, dans notre cas, cette méthode définira, à partir des informations que l'on a pour chaque internaute, son profil. Il y a bien évidemment des variables qui vont plus contribuer que d'autres. Les variables explicatives les plus discriminantes dépendent et varient d'un client à un autre, d'un pays à l'autre, etc. Nugg.ad délivre un profil qui peut aller jusqu'à 70 variables standards, comportant les données sociodémographiques mais aussi les centres d’intérêts, les préférences d'achat et autres. Pour mesurer la qualité de chacun de ses modèles, Nugg.ad utilise la validation croisée. C'est une méthode d’estimation de fiabilité d’un modèle fondée sur une technique d’échantillonnage. Il existe plusieurs méthodes, mais le principe reste à peu près le même : avant de faire le modèle une petite partie des données est retirée, on créée notre modèle à partir des données restantes puis une fois le modèle élaboré, on le teste sur les données que l'on avait retirées. Ils sont donc capable de déterminer la qualité de toutes leurs variables de prédiction avant même d'utiliser les modèles et donc modifier ce modèle si besoin est. Nugg.ad peut croiser les données de différents sites selon les détails contractuels de chaque client. Par défaut, Nugg.ad stocke et traite les données dans des silos2 pour chaque client. Voici quelques exemples de méthodes d'apprentissage automatiques que Nugg.ad pourraient utiliser : Arbres de décision boostés et agrégés Analyse discriminante Classification des k plus proches voisins Classifieur bayésien naïf Un problème survient alors : 48% d'ordinateurs sont partagés en France. Il y a donc obligation de traiter les données en temps réel pour cibler la personnalité de l'utilisateur actuel. Le traitement des informations se fait quasi-instantanément, souvent en moins d'une seconde. 2 En informatique, un silo est un dispositif fournissant ou recevant de l'information, ce peut être soit un périphérique soit un fichier Big Brother du XXIème siècle : le ciblage commercial 8
Projet de Sciences Humaines – 3ème année Génie Mathématiques L'indicateur utilisé généralement pour calculer la réussite d'un ciblage est le « clic ». Cependant c'est bien souvent un mauvais indicateur. Nugg.ad utilise d'autres indicateurs qu'ils jugent plus pertinents comme l'évolution du nombre d'achats, l'évolution de la notoriété du client suite au ciblage, etc. SCHEMA 3.1 : RECAPITULATIF DU PROCEDE NUGG.AD Certains sites ont plus tendance à créer des cookies que d’autres. C’est notamment le cas des réseaux sociaux comme Facebook qui a récemment mis à jour sa politique sur la confidentialité des données afin de rendre « plus claire » l'utilisation des données des utilisateurs. Il est désormais possible de choisir quelles sociétés sont autorisées à utiliser nos cookies3. Nous pouvons tout de même choisir de ne pas diffuser nos cookies mais les publicités qui apparaîtront ne seront pas ciblées. Il est clair, et Facebook ne s'en cache pas, qu'ils utilisent les données pour le ciblage prédictif. Au mois d'octobre 2014, Facebook a mis sur le net une vidéo expliquant comment diffuser une pub sur leur site à partir d’une page 4. Il suffit à un commerçant, entrepreneur ou autres de saisir quelle population il souhaite toucher ainsi que les centres d’intérêts qui correspondre à ces individus. Comme Facebook ne passe pas par un autre site pour générer ses pubs, il utilise ses propres données. C’est beaucoup plus simple car tous les utilisateurs de ce réseau social ont 3 Lien de la page permettant de gérer les cookies sur Facebook : http://www.youronlinechoices.com 4 Lien de la vidéo explicative pour créer des publicité : https://www.youtube.com/watch?v=JXX9eAneBno Big Brother du XXIème siècle : le ciblage commercial 9
Projet de Sciences Humaines – 3ème année Génie Mathématiques renseigné, à leur inscription, leur date de naissance et leurs centres d’intérêt. Il ne reste plus qu’à retrouver dans leur base de données les personnes correspondant au ciblage souhaité par l’annonceur et elle apparaitra sur le fil d’actualité de ses personnes, précédé de la mention « sponsorisé ». Facebook utilise probablement une méthode différente de celle de Nugg.ad, mais le principe est le même. III. Points forts et répercutions dans la société a) Avantages pour les entreprises La publicité en ligne comprend de nombreux avantages pour les professionnels ayant un produit à vendre ou une marque à faire connaître. En effet, grâce à Internet, les entreprises peuvent cibler les clients qui les intéressent le plus. Par exemple, les marques vendant des produits pour les nouveaux nés vont plutôt cibler les jeunes parents. Les entreprises gagneront du temps en ciblant uniquement les clients concernés par leurs offres et cela augmentera aussi leurs bénéfices. Le ciblage comportemental prédictif permet de créer des cibles sur-mesure. Le nombre de cibles est illimité et ce ciblage a lieu en temps réel. Aussi, les publicités proposées sont adaptées au profil fiable de l’internaute, cela augmente les chances d’achat pour les entreprises et donc l’augmentation des bénéfices. On peut savoir rapidement l’impact d’une campagne publicitaire et ainsi en déduire des analyses de performance des différentes campagnes. On peut en mesurer le succès contrairement aux autres formes de publicité. Le retour est quasiment instantané pour les entreprises qui peuvent se positionner sur l’intérêt suscité de leurs produits. Ainsi, elles pourront mettre en valeur un produit qui a plus de succès que les autres afin d’attirer le maximum de personnes sur leur site Internet toujours selon le profil des internautes. La publicité est également diffusée beaucoup plus rapidement par ce canal que par les autres canaux plus classiques comme le courrier ou le démarchage. C’est un gain de temps pour les entreprises mais aussi un gain de stockage des plaquettes publicitaires qui se réduisent au détriment de la publicité en ligne. Enfin, à l’heure où l’écologie est un enjeu du 21 ème siècle, ces publicités en ligne engendrent une réduction des impressions papiers. Cela diminue donc une petite partie des déchets ménagers qui ont un impact sur l’environnement. Big Brother du XXIème siècle : le ciblage commercial 10
Projet de Sciences Humaines – 3ème année Génie Mathématiques b) Avantages pour les internautes La publicité en ligne comprend aussi quelques avantages pour les internautes voulant acheter un produit en particulier. En effet, on peut acheter plus rapidement et plus facilement en cliquant simplement sur la bannière publicitaire proposée. La publicité prédictive se base souvent sur les dernières pages Internet consultées. Ainsi, les annonces seront plus pertinentes et utiles pour les consommateurs puisqu’elles sont ciblées selon les préférences des internautes et leurs habitudes d’achats. c) Un petit problème de lois… Même si le site Nugg.ad rendent anonyme toutes les données qu’ils reçoivent et ne les stockent pas, ce n’est pas la majorité des sites de publicités en ligne. Il est difficile de savoir si les données sont anonymes ou non. En effet, la plupart des sites Internet utilisent un identifiant. Dans ce cas, les données sont considérées comme étant anonymes. Cependant, avec un identifiant et beaucoup de données concernant une personne en particulier, il peut s’avérer très facile de retrouver la trace de l’internaute en question (sexe, localisation, ses goûts, ses préférences, son âge, …). De ce fait, peut-on considérer que les données collectées sont anonymes si l’on peut retrouver l’identité de l’internaute ? Il existe la loi « Informatique et libertés » du 6 janvier 1978 qui s’applique aux données personnelles collectées (adresse IP, les goûts et les comportements des internautes, …). En effet, l’internaute doit être informé quant à l’utilisation de ses données personnelles, sur la durée de conservation de ses données, sur les traitements utilisés qui doivent être sécurisés. Il a aussi le droit de s’opposer à ce que ses données soient utilisées. L’application de cette loi est exigée par l’ensemble des CNIL européennes. Cependant, pour les données issues du ciblage commercial, cette loi n’est pas obligée d’être appliquée. Ce qui pose un réel problème de confidentialité et de respect de la vie privée des internautes. En effet, ceci peut être considéré comme une introduction dans la vie privée des internautes et ceci est contraire à l’article 9 du code civil5. Le non-respect de cet article peut entraîner séquestre, saisie et autres, c’est au juge d’apprécier la sanction selon la gravité de l’intrusion. 5Article 9 du code civil : Chacun a droit au respect de sa vie privée. Les juges peuvent, sans préjudice de la réparation du dommage subi, prescrire toutes mesures, telles que séquestre, saisie et autres, propres à empêcher ou faire cesser une atteinte à l'intimité de la vie privée : ces mesures peuvent, s'il y a urgence, être ordonnées en référé. (Source : legifrance.fr) Big Brother du XXIème siècle : le ciblage commercial 11
Projet de Sciences Humaines – 3ème année Génie Mathématiques Un second problème juridique du ciblage comportemental est la classification des internautes en catégorie. Cela peut être vu comme une forme de discrimination fondée. Par exemple, les informations collectées permettent de sélectionner des personnes recevant une offre d’emploi en fonction de leurs orientations sexuelles, de leur couleur de peau ou encore de leurs opinions politiques. Enfin, les sites peuvent moduler leurs prix de vente en fonction du profil bancaire de l’internaute. Toutes ces formes de discriminations indirectes (citées dans l’article 225-16 du code pénal) sont punies par la loi (article 225-27 du code pénal). Une entreprise opérant ce genre de discrimination est passible de 3 ans d’emprisonnement et de 45 000€ d’amende. De plus, il y a un nouveau règlement européen qui sera mis en place et qui limitera les profils réalisés. Ainsi, aucune donnée privée (adresse IP comprise) ne pourra être récoltée et les données publiques devront être anonymes. Ainsi, si un hacker prend le contrôle du système, il ne pourra récupérer aucune donnée personnelle. Enfin, il existe des labels comme EuroPriSe qui certifie que les données peuvent être utilisées tout en protégeant la vie privée des personnes concernées. Il certifie donc la protection des données personnelles. Nugg.ad est la seule entreprise européenne dans le ciblage comportemental prédictif à avoir ce label. On peut en conclure que la publicité en ligne n’est pas sans danger pour les internautes ainsi que pour les entreprises collectant les données et réalisant des profils. En effet, selon les différentes accusations, une entreprise peut être passible d’emprisonnement et d’amende allant jusqu’à 45 000€. Enfin, pour l’internaute, c’est le non-respect de sa vie privée qui est en cause dans ce type de publicité. 6 Article 225-1 du code pénal : Constitue une discrimination toute distinction opérée entre les personnes physiques à raison de leur origine, de leur sexe, de leur situation de famille, de leur grossesse, de leur apparence physique, de leur patronyme, de leur lieu de résidence, de leur état de santé, de leur handicap, de leurs caractéristiques génétiques, de leurs moeurs, de leur orientation ou identité sexuelle, de leur âge, de leurs opinions politiques, de leurs activités syndicales, de leur appartenance ou de leur non-appartenance, vraie ou supposée, à une ethnie, une nation, une race ou une religion déterminée. Constitue également une discrimination toute distinction opérée entre les personnes morales à raison de l'origine, du sexe, de la situation de famille, de l'apparence physique, du patronyme, du lieu de résidence, de l'état de santé, du handicap, des caractéristiques génétiques, des moeurs, de l'orientation ou identité sexuelle, de l'âge, des opinions politiques, des activités syndicales, de l'appartenance ou de la non-appartenance, vraie ou supposée, à une ethnie, une nation, une race ou une religion déterminée des membres ou de certains membres de ces personnes morales. (Source : legifrance.fr) 7 Article 225-2 du code pénal : La discrimination définie aux articles 225-1 et 225-1-1, commise à l'égard d'une personne physique ou morale, est punie de trois ans d'emprisonnement et de 45 000 euros d'amende sous certaines conditions. (Source : legifrance.fr) Big Brother du XXIème siècle : le ciblage commercial 12
Projet de Sciences Humaines – 3ème année Génie Mathématiques IV. Evolution du Big Data par rapport au ciblage commercial Nous avons vu comment les publicitaires utilisaient nos cookies pour arriver à cibler au mieux les publicités en fonction des utilisateurs derrière leurs écrans. Il faut d’abord savoir que seuls 20% des cookies générés sont utilisés par les sites internet et qu’actuellement un certain nombre d’entreprises travaillent à optimiser l’utilisation tous les cookies générés. Ils obtiendraient ainsi des profils encore plus réels et cerneraient quasiment parfaitement les internautes et leurs besoins. En plus des cookies, il y a aussi des fichiers log Web créés lors d’une visite sur un site internet. Ces fichiers sont consultables du côté des gestionnaires du site. Ils contiennent de nombreuses informations en relation avec le site visité comme l’adresse IP, le nombre de connexions sur le site, le navigateur utilisé… Ces fichiers sont très peu exploités comparés aux cookies, car ils sont liés au site consulté. Si on ajoute ces fichiers Log Web aux cookies pas encore exploités, le ciblage prédictif se développera encore dans les années à venir pour obtenir un ciblage publicitaire encore plus optimisé. Big Brother du XXIème siècle : le ciblage commercial 13
Projet de Sciences Humaines – 3ème année Génie Mathématiques Conclusion Par le biais de cette synthèse, nous avons pu appréhender une utilisation spécifique du Big Data parmi une multitude d’autres : celle du ciblage commercial. Nous avons également vu la complexité des moyens mis en œuvre pour réussir à cibler la bonne publicité à la bonne personne, venant de l’explosion des données sur internet. Toutefois, l’utilisation de ces données nécessite de faire attention à la légalité due à l’exploitation de données personnelles. Cependant, Internet évolue de jour en jour et il reste encore de nombreuses ressources inexploitées. Big Brother du XXIème siècle : le ciblage commercial 14
Projet de Sciences Humaines – 3ème année Génie Mathématiques Bibliographie critique I – Définition et objectifs WIKIPEDIA, 2014. Ciblage comportemental [en ligne]. S.l. : s.n. [Consulté le 13 novembre 2014]. Disponible à l’adresse : http://fr.wikipedia.org/w/index.php?title=Ciblage_comportemental&oldid=105806228. Le ciblage comportemental est une technique de Ciblage qui consiste à personnaliser les contenus (articles textuels, produits, publicités), en fonction du comportement des internautes et de l'identification de leurs centres d'intérêt. BRASSEUR, Christophe, [sans date]. Enjeux et usages du Big Data : Technologies, méthodes et mise en oeuvre. Lavoisier. S.l. : s.n. [Consulté le 8 janvier 2015]. Management et Informatique. Ce livre permet une approche du big data pour comprendre comment on utilise ceci pour le ciblage commercial. II – Le principe du ciblage prédictif ANON., [sans date]. Publicite_Ciblee_rapport_VD.pdf. S.l. : s.n. Rapport de la CNIL réalisé en 2009 sur la publicité ciblé en ligne (technologie de traçage - constitution des profils prédictifs - les exemples de publicités en ligne - les menaces - les enjeux pour les autorités de protection des données). Ce rapport a été utilisé pour construire plusieurs parties du dossier et pas uniquement celle sur le principe du ciblage prédictif. ANON., [sans date]. nugg.ad Predictive Behavioral Targeting - nugg.ad. In : [en ligne]. [Consulté le 11 décembre 2014 i]. Disponible à l’adresse : http://www.nugg.ad/fr/. Site Internet d’une société de ciblage prédictif. Nous nous sommes servis de leurs études de cas afin de compléter notre dossier. Nous avons également contacté des membres de l’équipe afin de comprendre les méthodes mathématiques utilisées dans leurs algorithmes de ciblage prédictif. ANON., [sans date]. Criteo. In : [en ligne]. [Consulté le 11 décembre 2014 d]. Disponible à l’adresse : http://www.criteo.com/fr/. Site Internet d’une société de ciblage. Nous avons tenté de comprendre via leur site Internet comment fonctionnait cette société afin de cibler au mieux les internautes. III – Points forts et répercutions dans la société ANON., [sans date]. Accueil | Légifrance, le service public de l’accès au droit - Accueil. In : [en ligne]. [Consulté le 18 décembre 2014 a]. Disponible à l’adresse : http://www.legifrance.gouv.fr/. Site Internet expliquant les différentes lois françaises et les sanctions encourues en cas de non-respect de cette dernière : utile pour la partie concernant les problèmes de loi afin de voir les sanctions dont étaient passibles les entreprises de ciblages. Big Brother du XXIème siècle : le ciblage commercial 15
Projet de Sciences Humaines – 3ème année Génie Mathématiques BEM, Anthony, [sans date]. Ciblage des clients sur internet par les annonceurs et les publicités: une atteinte à la vie privée? In : [en ligne]. [Consulté le 11 décembre 2014]. Disponible à l’adresse : http://www.legavox.fr/blog/maitre-anthony-bem/ciblage-clients-internet-annonceurs-publicites- 14530.htm#.VIlorqOqLDw. Le ciblage des clients sur Internet du point du vue législatif. Les problèmes rencontrés et le non-respect de certaines lois sont détaillés dans cet article écrit par un avocat. ANON., [sans date]. Retargeting - Le reciblage publicitaire pour e-commerçants. In : [en ligne]. [Consulté le 13 novembre 2014 k]. Disponible à l’adresse : http://www.commentcamarche.net/faq/20889-retargeting-le-reciblage-publicitaire-pour-e- commercants. Explication des avantages et des inconvénients du ciblage publicitaire pour les entreprises et pour les internautes ANON., [sans date]. Marketing ciblé sur internet : vos données ont de la valeur - CNIL - Commission nationale de l’informatique et des libertés. In : [en ligne]. [Consulté le 18 décembre 2014 h]. Disponible à l’adresse : http://www.cnil.fr/les-themes/internet-telephonie/fiche- pratique/article/marketing-cible-sur-internet-vos-donnees-ont-de-la-valeur/. Rapport de la CNIL explicitant les différents problèmes liés à l'utilisation des données en ligne ANON., [sans date]. Le ciblage comportemental: quelles applications?? Quelles limites?? - Leaders League. In : [en ligne]. [Consulté le 13 novembre 2014 g]. Disponible à l’adresse : http://www.leadersleague.com/news/view/id/ca30c126912b75fcd80d3c78af1dd199. Ce site développe l'utilisation du big data ainsi que les règlementations appliquées à l'usage de ce dernier. IV – Evolution du Big data par rapport au ciblage commercial Doru Tanasa, Brigitte Trousse [2004]. Data Mining Cours. S.l. : s.n. Ce pdf est un cours de l’INRIA présentant les fichiers log Web et leur utilisation dans le Data Mining. Big Brother du XXIème siècle : le ciblage commercial 16
Projet de Sciences Humaines – 3ème année Génie Mathématiques Diagramme de Gantt Big Brother du XXIème siècle : le ciblage commercial 17
En 2008, le nombre d’objets connectés a dépassé le nombre d’humains, ce qui a eu pour effet de multiplier la quantité de données. L’expression utilisée pour ces données est le « Big Data » désignant à la fois la gestion puis l’analyse de ces énormes volumes de données générées notamment par les utilisateurs d’Internet. Dans cette étude, nous exposons tout d’abord les principes du Big Data et ses applications dans le ciblage commercial. Nous nous sommes focalisé sur le ciblage prédictif, ses points forts et ses répercussions dans notre société. En effet, le ciblage prédictif utilise des données personnelles ce qui cause certains problèmes de lois. Cependant cette méthode s’avère très efficaces pour les entreprises. L’explosion exponentielle des données rend les techniques de Big Data nécessaires de nos jours. Mots-clés : Big Data – Ciblage commercial – Ciblage prédictif --------- In 2008, the number of connected objects exceeded the number of humans in the world, multiplying the amount of data. The term used for this data is “Big Data”,referring both to the management and analysis of those huge volumes of data generated especially by web users. In this study, the principles of Big Data and its applications in commercial targeting will be developed, focusing first on predictive targeting, its strengths and its impact in our society. Actually, predictive targeting uses personal data, which raises legal problems. However, this method is very effective for companies. The exponential explosion of data makes the use of Big Data techniques necessary nowadays. Keywords : Big Data – Commercial targeting – Predictive targeting Big Brother du XXIème siècle : le ciblage commercial 18
Vous pouvez aussi lire