Google l'entonnoir - Gabriel Gallezot - Wiki URFIST

 
CONTINUER À LIRE
Google l'entonnoir - Gabriel Gallezot - Wiki URFIST
Google l’entonnoir

    Gabriel Gallezot
Google l'entonnoir - Gabriel Gallezot - Wiki URFIST
Google
            Qu’est-ce que c’est ?
  • 1996 :
       – projet de recherche BackRub, de Sergey Brin et Larry
         Page (en PhD à Stanford) : méthode d'analyse des liens
         pointant vers un site web.
       – Naissance le 7 septembre 1998, à Stanford, de la start-
         up Google
       – Le nom : dérivé du mot «googol » , nombre gigantesque
         (un 1 suivi de 100 zéros...).
  •   1999 : de 500 000 à 3 millions requêtes par jour

PR(B) = (1-d) + d x ( PR(A1) / N(A1) + ... + PR(An) / N(An) )

                                                     A partir des dia de l’Urfist de Rennes
Google l'entonnoir - Gabriel Gallezot - Wiki URFIST
La machine s’emballe ...
• 2000 : premières publicités contextuelles, un demi-milliard de
  pages Web indexées ; déjà 100 millions de requêtes par jour
• 2001 : Rachat de Deja.com et de l'archivage de Usenet,
  création de Google Groups ; lancement de Images Search;
  indexation de nouveaux formats de fichiers (.doc; .xls, .ppt...)
• 2002 : Lancement du modèle publicitaire des AdWords ;
  lancement officiel de Google News, indexant plus de 4000 sites
  de médias ; Fin 2002 : 250 millions de requêtes journalières
• 2003 : Rachat de plusieurs sociétés :
   – Applied Semantics : technologie autour des mots-clés
   – Blogger : édition de blogs
   – Sprinks : publicité contextuelle
   – Programme publicitaire AdSense

                                                     A partir des dia de l’Urfist de Rennes
Google l'entonnoir - Gabriel Gallezot - Wiki URFIST
... et ça continue
• 2004 :
  – Recherche localisée avec Google Local.
  – Gmail, service de webmail gratuit
  – Introduction en Bourse, envolée boursière
  – Picasa, gestion des photos numériques
  – Google Desktop, indexation des disques durs
  – Novembre : doublement de l’index : de 4,3 milliards à 8,1
    millards de pages
  – Google Scholar
• 2005 :
  – Lancement de : Google Video, Google Maps, Google Earth,
    Google Talk
  – Annonce de Google Print et de la numérisation des livres
  – Augmentation de l’action Google de 117 % en un an
  – Fin 2005 : 1 milliard de requêtes journalières !

                                                      A partir des dia de l’Urfist de Rennes
Google l'entonnoir - Gabriel Gallezot - Wiki URFIST
... et encore
• 2006 :
   – Lancement de Google.cn en Chine, avec une censure des
     résultats
   – Rachat de Writely, qui deviendra Google Docs & Spreadsheets
     en octobre
   – Lancement de plusieurs applications : Google Calendar, Co-Op,
     Trends, Apps...
   – Automne : Google News Archives, rachat de You Tube
• 2007 :
   – Rachat de DoubleClick, pour $ 3,1 Mds ;
   – Automne : 1 million de livres numérisés, 27 partenaires pour
     Google Books
• 2008 :
   – Mars : annonce de Google Health, le dossier médical personnel
     en ligne
   – Juin : partenariat avec Yahoo pour le partage du marché
     publicitaire
   – Juillet : Google a70 % du trafic aux USA, 82 % en France
   – Septembre : lancement du navigateur Google Chrome
                                                    A partir des dia de l’Urfist de Rennes
Google l'entonnoir - Gabriel Gallezot - Wiki URFIST
etc...
• 2009 :
   – Février : lancement de Google Latitude, service de géolocalisation
     sur téléphone mobile
   – Mai : lancement de Google Wave, plateforme centralisée de
     communication
   – Septembre : lancement de SideWiki
   – Octobre :
      • Partenariat avec Twitter, indexation des tweets
      • lancement de Google Social Search, moteur de recherche
        social
   – Novembre :
      • Lancement de Google DashBoard

       ...

       •     .... Dernières annonces en date (mai 2010)
       •     relooking de Google (léger)
       •     Google e-book store (cet été ?)
       •     ....                                         A partir des dia de l’Urfist de Rennes
Google l'entonnoir - Gabriel Gallezot - Wiki URFIST
... Bref
Innovations + rachats + marketing
⇒ Du PageRank au « PageBank »
•   Publicité = 97% de son CA => régie publicitaire
• dernier trimestre 09 : 5,9 Mrds $ de revenus
• Des réserves de trésorerie au plus haut : 22 Mrds $

                                          Hégémonie de google
                                          sur le marché des
                                          moteurs => recettes
                                          publicitaires
                                          imporantes

                                                      A partir des dia de l’Urfist de Rennes
Google l'entonnoir - Gabriel Gallezot - Wiki URFIST
Une liste à pub
• En Europe, 8 requêtes sur 10 passent par
  Google
• Usages : utilisation des 1er résultats
• Illusion d’infini : affiche des millions de résultats
  en réalité inacessibles (blocage avant les 1000
  résultats)
• Aspect tautologique : les 1er résultats toujours
  renforcés

...et mes traces de navigation ?
• Conservation des requêtes (Cf google trends,
   Dashboard) et cookies
Google une régie publicitaire

Premium SponsorShip (CPM)

                                                                            Adwords Select (CPC

                                                                     Résultats du « page rank »

                                          QuickTimeᆰ et un
                                        dホcompresseur BMP
                            sont requis pour visionner cete image.
Golden
                                                               Triangle

http://eyetools.com/research_google_eyetracking_heatmap.html
Comprendre Google

Voir google pour ce qu’il est :
- pas un outil magique (« I’m feeling lucky »)
- pas le diable (« don’t be evil »)

=> mais un média
Doc électro
             BdD                Doc papier                                           Internet
    Page web
               liens news
  blog forum
               mail microblogging
                                                                                E-services dans les nuages

       Documents

                                            Début OS en ligne (cf android)
                               Alimente

 Créer des médias
 adaptés à chacun.
                          Publics

Outils de Recherche
                                 om
                                  te

                                                                                          s
         vi r
                la

                                                s

                                                                                 s
              rte

                                                                                         e
               o

                               er

                                             og

                                                                                w
                              st
   eb

              s

                                                                                      ag
             ho

            dé

            re

                            al
          ca

                                                                             ne
                           cu

                                          bl
  W

                                                                                     im
         sc

        liv
Les axes de developpement
      du média google

• Paradigme du flux vs. paradigme du
  stock
• Economie de l’attention vs. économie
  de la rareté
Paradigme                                 Documents
                                          • Web

  du flux                                 • Numérisation

• Tri du web
• Numérisation de masse
• Crowdsourcing

                      The machine is us/ing us

                                                      Médias ciblés
                                                      pour un public

          Livraison                              Participation des foules à :
Sources               Public                     • La correction de pages
   Paradigme du stock                            • De bugs
                                      Web2.0     • D’amélioration de services
                                                 • ... alimentation
Economie de
                                        20% des produits
 l’attention                            font 80% des ventes

• Loi de Paréto / loi de puissance
   (20 / 80)

                                        Popularité
• économie de la rareté : rareté de
   l’offre, pression de la demande
   => coût du produit qui monte                                La longue traîne
• La longue traîne : c’est l’addition
   de produits qui se vendent peu
                                                              Produits
=> rendre chaque chose disponible
=> aider à la trouver
                                   ⇒ Rareté de la demande
                                   ⇒ Economie de l’attention
                                   ⇒ Captation de la demande,
                                   par la porte d’entrée
                                   « moteur de recherche »
... Et nous ...Et nos
                            documents dans tout
                                      ça ?
                       • Que deviennent les documents, leurs
                         relations, leur « vie sociale » ?
                       • Comment cet entonnoir redéfinit-il les
                         règles du jeu de l'usage de
                         l'information, et donc finalement de la
                         production des documents ?

=> Etudier les multiples impacts de son existence
sur la sphère informationnelle. Trouver les axes
d'analyse qui partent des pratiques des usagers,
du petit bout de l'entonnoir.
La notion de « flou » comme fil rouge
• méconnaissance des outils de recherche tend
  à objectiver les résultats fournis par Google.
=> Phénomène lié à l'intelligibilité des
  typologies et techniques documentaires, des
  techniques (algorithmiques) stochastiques et
  à la surcharge informationnelle.
• des usagers désorientés par la
  déconstruction/reconstruction de leur univers
  documentaire
=> En cause la versatilité des services, des
  sources, des interfaces d'interrogation,
  rythmée par les rachats et les fusions
  d'entreprises.
Quel flou ?

• Flou cognitif (perte d’intelligibilité)
• Flou sémiotique (perte de repères)

⇒ Différentes situations de flou
Le flou chez les étudiants
                       (Brigitte Simonot)

• un public acculturées aux moteurs de recherche placés dans
  une situation d’acquisition de méthodologie de travail
• Position hégémonique de Google, plébiscité pour sa facilité
  d’usage et son côté intuitif
• le recours fréquent aux moteurs n’amène pas les étudiants à
  questionner les fondements d’une démarche informationnelle
  aboutie et n’améliore pas leurs connaissances
  infodocumentaires
• Il leur donne surtout une illusion d’autonomie, entretenue par un
  manque d’intelligibilité des outils de recherche et des
  ressources documentaires.
• => formations pour mieux gérer, évaluer et maîtriser la densité
  d'information, acquérir une meilleure autonomie et ne pas
  laisser le moteur régler la sélection des sources à leur place.
Le flou chez les journalistes
         (Nicolas Pélissier et Mamadou Diouma Diallo)

• Public de spécialistes de l’information
• Ont fait la part belle à google dans leur colonnes
• montée en puissance des sources électroniques par rapport
  aux sources traditionnelles – orales et imprimées – dans
  cette profession
• des pratiques d’enquêtes de plus en plus sédentaires où le
  réseau prend une part grandissante (place de choix pour
  Google)
• ces professionnels de l’information semblent prendre peu de
  recul par rapport à leurs usages du moteur.
=> Les formations des journalistes devraient prendre en compte
  cet aspect pour doter les futurs professionnels d’éléments
  méthodologiques et éthiques plus poussés
La question de formation pour répondre au flou
              (Alexandre Serres et Olivier Ledeuf)
• Une formation aux outils de recherche doit s'appuyer
  plus largement sur le développement de la culture
  informationnelle
• Les auteurs relèvent plusieurs « confusions
  sémantiques » induites par les moteurs qui
  participent à un « brouillage » des notions info-
  documentaires.
   – Confusion entre les différentes approches de la pertinence :
     pertinence topicale (relevance), pertinence-système,
     pertinence-utilisateur.
   – Confusion entre mesures d’audience et influence.
   – Confusion enfin entre autorité et popularité.
• Face aux enjeux sociopolitiques soulevés les
  moteurs de recherche => la mise en œuvre d’un
  véritable travail de réflexion sur la didactique de
  l’information.
Le flou dans la machine
        (Olivier Ertzscheid, Gabriel Gallezot et Eric Boutin)
• de l’origine "scientométriques" du PageRank™ à son
  opacité (la boîte noire)
• Instrumentalisation du concept de pertinence par le
  moteur et son détournement au profit d’une logique
  marchande
• Des situations de flou et d’ambigüité s’installent,
  comprises entre une vision amoindrie de la réalité
  documentaire et une fuzzy search contrôlée
   – L’usager profane « decouvre » plus qui ne
      « recherche »
   – L’usager expert doit accepté l’aléatoire, la fortuité, la
      serendipité
• les usagers ont ou n'ont pas la possibilité ou la capacité
  de subjectiver leur recherche, du moins ne savent pas ou
  peu se défaire de l' « objectivation » imposée par Google
• => aspect didactique et heuristique de relevance et de la
  sérendipité pour combatre ce flou
Le flou de l’interface
               (Jacques Araszkiewiez)
• Analyse sémiologique de la page d’accueil
• Le sujet est avaler par l’interface, par la “one
  box” : “le grand a-valeur”
=> processus de désubjectivation du dispositif
  socio-technique
=> Avec le web les médias, comme dispositifs,
  ne sont plus seulement une représentation
  métaphorique du monde mais
  métonymique, jettant en cela un flou sur
  notre réel.
Le flou du discours
             (Céline Lacroix et Paul Rasse)

• Un discours qui oscille entre culture
  d’entreprise et valeurs culturelles universelles
• Le discours de Google s’appuie à la fois sur
  des valeurs politiques (ie. la démocratie) et
  économiques dont il joue à contre pied pour
  finalement mettre en exergue deux
  sentiments : la croyance et la confiance, qui
  sont dès lors érigées en valeurs
=> le discours affiché sur le site de Google
  procède d’une rhétorique publicitaire
  masquée faite de glissements de sens, un
  flou sémiotique bien entretenu
Le flou dans l’avenir
                 (Cory Doctorow)

• Un nouvelle de SF
• Comment se faire Engooglés
• Sur les dérives possibles des informations
  détenues et leurs utilisations
• Relations fictives entre le DHS (département
  of Homeland Security) et Google
• “évaluation” des individus à la douane des
  aéroports par la publicité contextuelle autour
  de leur documents (... puis dérives
  succesives)
... En guise de conclusion

Trop de google ?

Attention aux
associations
symbiotiques

Vos questions ?
Vous pouvez aussi lire