Digital humanities: des chiffres et des lettres . 10 - horizons
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
cher A détaguide Notre ctivités a de 20 tifiques scien Digital humanities: des chiffres et des lettres ...... 10 Et voici le bébé Une mouche pour La mer à trois parents ........ 34 la vie éternelle ....... 36 de plastique ........... 44
A la découverte d’homo digitalis Avec les humanités numériques, les sciences humaines adoptent elles aussi des outils informatiques puissants: digitalisation, bases de données, analyses statistiques, cartographie. Cette évolution leur permet bien entendu de travailler de manière plus efficace, mais également d’ouvrir de nouveaux champs de recherche. Il s’agit avant tout d’un nouvel outil, pas d’une baguette magique. Les chercheurs le savent bien: les corrélations découvertes dans une tranche de big data ne fournissent qu’une indication et n’apportent ni preuve, ni explication. Donner un sens à ces informations, y découvrir une causalité exigera toujours de passer par une interprétation qualitative et subjective de la situation. Comme l’écrivait Bruno Latour en 1993, les données ne tombent pas du ciel mais sont toujours «obtenues». Elles peuvent paraître objectives, mais ne sont, en fait, jamais neutres. Un point important, qui semble parfois échapper aux autorités, avides de recettes objectives et indiscutables. Cette mue remet en question les pratiques des sciences humaines, car tout outil modifie notre manière de percevoir le monde. Devant ces algorithmes tout-puissants, les chercheurs devront soigneusement réfléchir à la façon de préserver leur appréciation de la complexité et de l’ambiguïté. L’importance de la mue numérique des sciences humaines va au-delà de l’efficacité de la recherche. Car ce sont elles qui devront étudier homo digitalis et comprendre les bouleversements provoqués par le numérique sur la société dans son ensemble: redéfinition des rapports sociaux, abandon de la sphère privée, nouvelles manières d’assimiler l’information. Pour y parvenir, les sciences humaines devront absolument s’approprier ces nouveaux instruments. Car on ne comprend bien un phénomène que si l’on a pu l’éprouver soi-même. Daniel Saraga, rédacteur en chef
Sommaire 25 Aurel Märki Maximilian Schich and Mauro Martino Point fort Humanités numériques Science et politique 10 Humanités 2.0 24 Le plafonds de verre Une informaticienne révèle les facteurs invisibles qui freinent la carrière académique des femmes. Les méthodes numériques bouleversent les 25 Un tour de Suisse scientifique sciences humaines. Elles permettent de poser Notre guide vous propose 20 activités estivales aussi bonnes pour vos sens que de nouvelles questions et redéfinissent les pour votre cerveau. pratiques de recherche. Où nous emmènent 29 «La valeur la plus importante les Digital Humanities? d’une haute école est l’autonomie stratégique» Le recteur de l’Université de Bâle Antonio 13 Loprieno donne son avis sur les rankings L’historien et l’algorithme et le sponsoring privé. 17 Des nombres pour décrire le langage 21 Sauver les données de l’oubli 22 «Les humanités numériques ne sont pas une révolution» ◂ Couverture. Tinder en 1900. «Chère Mademoiselle! Vous envoie mes ◂ Couverture intérieure. Comment parle la Suisse en 2015? Des chercheurs cordiales salutations, ainsi qu’à Madame votre mère et à votre frère.» des universités de Zurich, Berne et Neuchâtel ont étudié des messages sur L’histoire ne dit pas si le signataire finit par passer l’anneau au doigt WhatsApp et élaboré un nuage de mots pour Horizons. La fréquence est de la destinataire. indiquée par la couleur et la taille. Le mot le plus utilisé en français: «pas». Photo: Keystone/Interfoto/Pulfer Image: Simone Ueberwasser, whatsup-switzerland.ch 4 Fonds national suisse – Académies suisses: Horizons no 105
34 40 44 Wikimedia Commons Keystone/Science Photo Library/Professors P. Motta & T. Naguro Keystone/AP Photo/Thanassis Stavrakis Biologie et médecine Culture et société Environnement et technique 34 40 44 Un père, deux mères «Il faut démocratiser Un océan de plastique Le Royaume-Uni autorise le don de l’Union Européenne» D’innombrables déchets de plastique mitochondries, une technique de Les succès des mouvements euro s’accumulent dans les cinq gyres procréation médicalement assistée sceptiques constituent un signal océaniques. fortement débattue. Comment réagit d’alarme, explique le politologue Yannis la Suisse? Papadopoulos. 46 De Dübendorf à Washington 36 43 Rita Thót transforme l’énergie solaire en Les mouches survivantes Des bébés mignons sous la loupe hydrogène. La physicienne de l’Empa a Pour découvrir les secrets de la longévité, La naissance des attractions touristiques été désignée l’une des «100 Leading Global les chercheurs se penchent sur les gènes Allaité par une louve Thinkers» par Foreign Policy. des insectes. 48 38 L’art de la déformation La pollution intérieure Des cellules photovoltaïques vivantes Les microparticules sont aussi présentes Des tsunamis dans les Alpes dans nos maison. Une étude suisse veut mieux les quantifier. 39 La vie sociale des bactéries Les renards domestiqués s’adaptent Contrer les pneumonies En image Lieu de recherche Verbatim 6 32 50 A la quête du neutralino En Zambie, auprès des poissons Remplir son rôle de scientifique d’aquarium Débat En direct du FNS et des Académies Comment ça marche? 8 51 Les universités doivent-elles s’enrichir 49 La ville en banlieue avec leurs spin-offs? La navette spatiale suisse Soar Fonds national suisse – Académies suisses: Horizons no 105 5
Au-delà du Higgs L’accélérateur de particules géant du CERN, le LHC, a redémarré en avril 2015. Son but: pour chasser de nou- velles particules avec 60% d’énergie supplémentaire. L’image ci-contre montre les jets de particules créés lors d’une collision. Les courbes dans la région grise sont reconstruites par ordinateur, à partir d’informations livrées par un détec- teur de 80 millions de pixels placé au centre. Les courbes marquées en rouge et vert sont en accord avec les mesures effectuées par les calori- mètres (les anneaux vert et rouge), des détecteurs qui arrêtent certaines particules et mesurent leur énergie. «Cet événement n’est pas excep- tionnel en soi, explique le physicien Steven Goldfarb. Le Modèle standard prédit qu’il survient de temps en temps. Mais l’observer avec une pro- babilité accrue fournirait une indica- tion en faveur de l’une des variantes de la supersymétrie.» Cette théorie a été développée pour répondre à des questions ouvertes telles que l’unifi- cation des forces fondamentales ou la matière sombre, qui constitue 80% de la masse totale de l’univers. Le trait gris discontinu à droite est l’indication d’une particule man- quante: soit un neutrino, soit un neutralino prédit par la supersymé- trie, soit encore une autre particule candidate pour la matière sombre. Le boson de Higgs a bien été observé en 2012, mais l’univers n’a pas encore livré tous ses mystères. dsa Image: ATLAS Experiment © 2014 CERN Fonds national suisse – Académies suisses: Horizons no 105 7
Débat Valérie Chételat (photomontage) Les universités doivent-elles s’enrichir avec leurs spin-offs? Des dizaines de start-up sont lancées chaque année en Suisse pour valoriser des recherches scientifiques financées en très grande partie par l’Etat. Les universités qui les ont soutenues devraient-elles s’enrichir en cas de succès commercial? Oui affirme le politicien Jean-François Steiert. Au cours des vingt dernières années, en- ’impôts exagérées, des fonds supplémen- d est la transparence. Si les hautes écoles viron un millier d’entreprises, le plus sou- taires doivent pouvoir être générés de cette veulent garder la confiance du contri- vent de petite taille, a contribué au succès manière et soutenir les jeunes chercheurs buable, elles doivent déclarer combien de la Suisse. La majorité d’entre elles sont dans la valorisation économique de leurs d’argent est généré par leurs start-up pros- prospères, même si les investisseurs en- innovations. pères. Cette information, elles la doivent clins à prendre des risques sont plus rares au contribuable qui, à raison, veut savoir en Suisse que par exemple aux Etats-Unis. si ses deniers sont bien investis dans la re- La plupart du temps, les spin-offs sont cherche, un domaine capital pour la Suisse. soutenues par l’argent du contribuable, au niveau des infrastructures, des réseaux so- «L’investisseur public doit Jean-François Steiert (PS) est conseiller national ciaux, des bourses ou des services de coa- pouvoir exiger une partie depuis 2007 et membre de la Commission de la ching des hautes écoles. L’objectif de ce science, de l’éducation et de la culture. genre d’investissements publics est avant du bénéfice.» tout d’encourager l’emploi et la recherche. Jean-François Steiert Grâce au soutien de fonds publics, ces innovations génèrent par le biais de ventes ou de brevets des bénéfices importants de l’ordre de dizaines ou de centaines de Lors de la vente des brevets, il ne s’agit ni millions de francs. L’investisseur public de viser le rendement maximal, ni de préle- doit pouvoir exiger une partie de ces bé- ver des bénéfices selon une clé unique. Les néfices. Non pas pour permettre à l’Etat hautes écoles ont besoin d’une marge de ou aux hautes écoles de s’enrichir, mais manœuvre pour optimiser le prélèvement. pour réinvestir ces fonds dans l’encou- D’un côté, il faut que la création et la direc- ragement de la prochaine génération de tion de start-ups restent attrayantes. De chercheurs. A l’heure où la Confédération l’autre, il convient de réinvestir de manière et les cantons mettent en place des pro- adéquate dans la prochaine génération de grammes d’économies en raison de baisses chercheurs. Ce qui fait défaut, aujourd’hui, 8 Fonds national suisse – Académies suisses: Horizons no 105
Non répond Hervé Lebret, gérant d’un fonds de place- ment de l’EPFL. Lorsque Marc Andreessen lança Netscape pense qu’il ne doit pas l’être. Néanmoins, analyse des termes de licences publiques en 1993, l’un des premiers browsers du Web, un retour indirect existe déjà: d’abord sous d’une trentaine de start-up.1 Elle montre l’Américain de 22 ans préféra repartir de la forme de l’impôt et, plus important en- que les universités prennent une participa- zéro plutôt que de signer une licence avec core, à travers les centaines de milliers tion moyenne de l’ordre de 10% à la création l’Université de l’Illinois, dont il jugeait les d’emplois créés par les start-up. Leur valeur de la start-up, qui se dilue à 1–2% après les conditions abusives. Au contraire, l’Uni- est, au final, bien supérieure aux dizaines premiers financements. versité de Stanford entretint des relations de millions de dollars rapportés chaque Il est impossible de connaître à l’avance moins tendues avec les fondateurs de Goo- année aux meilleures universités améri- le potentiel commercial d’une technologie. gle, en prenant une participation modeste caines par leurs licences. Il faut avant tout faire en sorte que celui-ci de 2% (qui lui rapporta 336 millions de ne soit pas pénalisé par des termes de li- dollars six ans plus tard lors de l’entrée en cence excessifs. Des conditions abusives bourse de la société). La même université peuvent démotiver l’entrepreneur avant ne demanda rien à Yahoo!, jugeant que les «Des conditions abusives même qu’il ne se lance et décourager les fondateurs avait développé le site sur leur investisseurs. Et ainsi tuer la poule dans temps libre. Quelques années plus tard, peuvent démotiver l’œuf. l’un des fondateurs de Yahoo! fit un don l’entrepreneur avant même de 70 millions de dollars à Stanford – alors Hervé Lebret est membre de la Vice-présidence qu’Andreessen, lui, ne veut plus entendre qu’il ne se lance.» pour l’innovation et la valorisation de l’EPFL et parler de son alma mater. Hervé Lebret directeur d’Innogrant, un fonds d’innovation de la Ces exemples montrent bien comment haute école lausannoise. les rapports entre universités et entreprises peuvent se tendre lorsqu’elles ne partagent 1 http://bit.ly/lebrstart pas la même perception de la valeur d’un Comment alors définir la juste rétribu- transfert de connaissances. Ce dernier est tion pour les universités? Le sujet est sen- souvent gratuit lorsqu’il s’agit de forma- sible, mais aussi mal compris, notamment tion, mais lorsqu’il est question de création à cause d’un manque de transparence des d’entreprises, l’écrasante m ajorité des gens différents acteurs. En 2013, j’ai publié une Fonds national suisse – Académies suisses: Horizons no 105 9
Point fort Humanités numériques Des chiffres et des lettres Les sciences humaines adoptent elles aussi les technologies numériques. Ces outils offrent un nouveau regard sur notre culture et obligent les chercheurs à redéfinir leur discipline. 10 Fonds national suisse – Académies suisses: Horizons no 105
Fonds national suisse – Académies suisses: Horizons no 105 11
12 Fonds national suisse – Académies suisses: Horizons no 105
Point fort Humanités numériques ces données, un algorithme estime avec une certaine probabilité l’emplacement des frontières à telle ou telle époque. Ces outils numériques ne dispensent Le numérique pas le chercheur de son travail de terrain, souligne Sylvian Fachard. Une fois les pré- entre dans l’histoire dictions livrées par le modèle, il remet son chapeau d’archéologue et cherche des in- dices pour les confirmer ou les infirmer. «Il est nécessaire d’interpréter toutes les don- nées afin de produire un résultat pertinent. Historiens et archéologues Le numérique génère encore davantage apprennent à apprivoiser les outils d’informations qu’il faut articuler entre elles. Cela réclame un niveau d’analyse plus informatiques. Une évolution complexe.» inéluctable qui a le potentiel L’histoire collective de bouleverser ces disciplines. Autre profonde mutation induite par le nu- Par Fabien Goubet mérique, le changement d’échelle. «Dans la culture digitale, on passe du solitaire au col- lectif, comme l’ont fait les sciences dures, note Claire Clivaz. Les articles sont signés par des collaborations de chercheurs et non L plus par des auteurs uniques.» e monde se numérise et les sciences La composante temporelle est également humaines n’y échappent pas. Elles affectée, ajoute Sylvian Fachard: «Nous aussi se métamorphosent sous l’in- partons en fouilles équipés de tablettes fluence des ordinateurs et des al- tactiles qui nous permettent de centraliser gorithmes. Il ne s’agit évidemment pas en temps réel les données récoltées. Nous de simples outils de traitement de texte pouvons adapter notre stratégie au jour le ou de messagerie, mais bien de profondes jour. Cela nous apporte une souplesse in- mutations qui s’immiscent dans toutes croyable.» «Le rythme de la science évolue, les étapes de production des savoirs, de la ajoute Claire Clivaz. La production est assu- numérisation des sources à leur analyse. rée en continu, notamment avec les blogs Emergence de nouvelles pratiques, appa- sur lesquels s’expriment les chercheurs.» rition de nouveaux métiers, adaptation nécessaire des formations universitaires: les humanités numériques ont tout pour rebattre les cartes des sciences humaines. Le terme «digital humanities» n’est ap- paru officiellement à l’écrit qu’en 2004, «Il n’y a plus un texte unique précise Claire Clivaz, professeure invitée dans une version donnée, au Laboratoire de culture et humanités digitales de l’Université de Lausanne: «On mais une véritable généalogie parlait auparavant de ‹humanities and de toutes les versions.» computing› comme si ces deux notions se faisaient face.» Le changement sémantique montre qu’elles sont aujourd’hui intime- ment liées. L’ordinateur dessine les frontières Claire Clivaz étudie les manuscrits du Les travaux de Sylvian Fachard, de l’Uni- Nouveau Testament, et le numérique per- versité de Genève, illustrent bien les nou- met de mettre enfin la main sur une par- velles possibilités offertes par le numé- tie des quelque 5800 manuscrits rédigés en rique. Ce spécialiste de l’archéogéographie grec ancien. Mais le numérique change éga- veut déterminer le tracé des frontières des lement la manière de penser ce qu’est un différentes communes de l’Attique, la ré- document historique. «Il n’y a plus un texte gion entourant Athènes, entre le Xe et le unique dans une version donnée, mais une ◂ Pages 11 et 12. Représenter la Ier siècle av. J.-C. «Les quelques rares textes véritable généalogie de toutes les versions, vie de Newton, de Washington et qui nous sont parvenus ont tous été analy- note la chercheuse. Le texte devient par d’autres géants de l’histoire par un sés au début du XXe siècle et ne permettent conséquent multiforme. Cela change com- portrait ou sur une carte? Une équipe pas de replacer les frontières sur une carte», plètement notre état d’esprit: avant, on emmenée par Dirk Helbing, d’ETH explique Sylvian Fachard. Face à cette im- cherchait la version la plus ancienne à tout Zurich, a relié les lieux de naissance passe, le chercheur recourt à la modélisa- prix, tandis qu’on perçoit maintenant un et de mort de 120 000 personnalités tion spatiale de la région. Il répertorie en texte comme évoluant dans une histoire de au cours des 2600 dernières années fonction de l’espace et du temps tous les ob- la lecture.» pour illustrer les déplacements des jets, ruines et autres tombeaux découverts Citant l’historien du livre Roger Char- centres intellectuels. lors de fouilles, et croise ces informations tier, la chercheuse insiste sur le fait que Images: Wikimedia Commons, Wellcome Library avec des données géographiques telles que le support de l’information modèle notre (p. 11); M. Schich et M. Martino (2014) (p.12) la topographie du terrain. En fonction de façon de penser. Et d’ajouter: «Plus encore Fonds national suisse – Académies suisses: Horizons no 105 13
Point fort Humanités numériques que l’imprimerie, la révolution numérique Gubler, directeur adjoint du RAG. La nature sociologues, informaticiens, statisticiens. est la rupture la plus importante depuis numérique de notre index rend également «Nous avons besoin de profils capables de le passage du rouleau de parchemin au possible l’établissement de davantage de faire le lien entre tous ces univers», sou- codex (un cahier composé de pages manus- liens avec d’autres projets de recherche.» ligne Bella Kapossy, du Laboratoire de crites, ndlr)». cultures et humanités digitales de l’Uni- Big data du passé versité de Lausanne. Toute évolution d’une Générer des hypothèses La puissance des outils numériques peut discipline amène une redéfinition poten- Cette rupture est notamment marquée par faire rêver, mais des promesses empha- tielle de son identité. Comme le dit Claire un changement de relation entre les histo- tiques sont aussi susceptibles d’attiser les Clivaz: «L’un des défis posés par cette révo- riens et leurs sources. Martin Grandjean, critiques. Venice Time Machine, un projet lution est de savoir jusqu’où collaborer avec un doctorant en histoire à l’Université de médiatique de l’EPFL,ambitionne de recréer des personnes issues d’autres disciplines Lausanne, planche sur les archives de la la Cité des Doges des douze derniers siècles sans perdre notre identité.» Société des Nations afin de comprendre à partir des archives d’Etat vénitiennes. comment les chercheurs allemands actifs La première étape consistera à numériser Fabien Goubet est journaliste scientifique et écrit durant l’entre-deux-guerres ont réussi à les millions de documents (quelque 80 ki- pour Le Temps. revenir au premier plan européen malgré lomètres d’archives) existants. «Analyser leur mise à l’écart. Il élabore pour cela une autant de documents serait tout bonne- cartographie spatiotemporelle de leur cor- ment impossible pour des êtres humains», respondance. avance Frédéric Kaplan, chef d’orchestre du projet et professeur au Laboratoire d’hu- manités digitales de l’EPFL. Ce seront donc des machines qui devront déchiffrer les écritures manuscrites et en extraire des données telles que le prix de «L’un des défis est de savoir la cannelle importée d’Orient, le salaire des jusqu’où collaborer avec des condottieri ou encore la liste des apprentis maçons à une époque donnée. «En résumé, personnes issues d’autres ce projet, c’est faire du big data du passé disciplines sans perdre notre pour créer les Google Maps et le Facebook de Venise», lance Frédéric Kaplan. Il com- identité.» pare son projet au séquençage du génome humain, «une grande infrastructure qui permettra d’aider de nombreux chercheurs par la suite». Avec ses partenaires vénitiens, le chercheur espère même mettre sur pied «Le contenu des lettres m’intéresse une visite touristique virtuelle de la Séré- moins que les métadonnées, à savoir qui nissime sur smartphone. a écrit à qui et à quelle date», explique le Cette vision grandiose attise le scepti- chercheur. Il esquisse ensuite des repré- cisme, voire la méfiance, de certains histo- sentations schématiques des métadonnées riens qui préfèrent ne pas être cités. Leur dans l’espoir de faire émerger des informa- critique: le projet manquerait de cadrage tions qui auraient jusqu’ici échappé aux et nécessiterait des approches historiques historiens. Mais aussi riche que puisse être complémentaires. Mais Frédéric Kaplan sa cartographie, elle ne représente pas un reste sûr de lui: «Nous publierons bientôt résultat en tant que tel: «La visualisation de une modélisation complète d’un premier données me donne des idées et me suggère quartier de Venise, celui du Rialto.» des hypothèses. Comme n’importe quel Les universités suisses en mutation historien, je dois ensuite les vérifier en me Garder son identité plongeant dans les archives.» Les humanités numériques resteront-elles Onze ans après son apparition, l’expression Ces visualisations de données com- de simples outils dans la trousse des his- «digital humanities» commence à se faire plexes se trouvent également au cœur toriens, ou annoncent-elles l’avènement une place dans le cursus académique. En d’un projet de recherche des universités de d’une discipline à part entière? «C’est ce Suisse, étudiants et chercheurs ont à leur Berne et de Giessen, le Repertorium Aca- que je pense, mais cette question est su- disposition des cours, des ateliers et des demicum Germanicum (RAG). Aux racines jette à débat au sein de la communauté», séminaires ponctuels. Depuis cette année, de celui-ci, une base de données sur 50 000 répond Frédéric Kaplan, alors que Sylvian la Faculté des lettres de l’Université de savants et intellectuels ayant fréquenté les Fachard réaffirme «rester un archéologue Lausanne (UNIL) propose également 30 universités du Saint-Empire romain ger- avant tout». Claire Clivaz nuance: «Pour crédits de spécialisation en digital humani- manique entre 1250 et 1550. En principe, moi, ce n’est ni l’un ni l’autre. Je vois plutôt ties au niveau master. rien n’interdirait d’établir ce «who’s who» les humanités numériques comme un label Le réseau européen Dariah répertorie tous sans outil numérique, mais il serait bien de transition, car en définitive les sciences les cours disponibles, sur une carte en ligne, plus difficile d’interpréter les résultats. Les humaines et sociales seront numériques bien évidemment. Une douzaine d’en- chercheurs ont choisi de les présenter sur quoi qu’il arrive. Si bien que les adjectifs trées suisses y figurent, réparties entre les une carte en fonction du temps, une visua- ‹numérique› et ‹digital› pourraient bien dis- universités de Genève, Lausanne, Berne et lisation originale qui, là aussi, peut faire paraître d’eux-mêmes, par évidence.» Bâle, partenaires de cette infrastructure. Le naître des nouvelles hypothèses. «Cet outil Les passerelles que lance le numérique paysage helvétique va encore évoluer dans nous permet de repenser le rôle des uni- ne sont pas toujours faciles à fréquen- les mois à venir, notamment avec un projet versités médiévales dans une perspective ter. Dans les couloirs de ces nouveaux de Master interfacultaire en humanités beaucoup plus large, commente Kaspar centres se croisent désormais historiens, digitales à l’UNIL. 14 Fonds national suisse – Académies suisses: Horizons no 105
Fonds national suisse – Académies suisses: Horizons no 105 15
16 Fonds national suisse – Académies suisses: Horizons no 105
Point fort Humanités numériques exceptionnelle de 150 000 œuvres litté- raires recouvrant trois millénaires en 80 langues. On y trouve, entre autres, le plus ancien manuscrit de l’Evangile de Jean 200 ans de littérature datant du IIe siècle ainsi que les originaux des contes des frères Grimm. en 0,4 seconde Le citoyen à l’aide Mais numériser des ouvrages est une tâche pénible. «Il faut couper les livres à la main avant de scanner chaque page séparé- La lecture lente a vécu: des ordinateurs ment, détaille Martin Volk, qui a numérisé avalent des millions de livres en un rien dans son projet plus de 120 000 pages. On a alors uniquement des images, mais pas de de temps. Et nous proposent leur propre texte.» La reconnaissance des textes est ef- analyse. Par Mirko Bischofberger fectuée par des programmes qui identifient les lettres dans les images et les transfor- ment en mots. «Mais le taux d’erreurs reste encore assez élevé, notamment avec des écrits anciens du XIXe siècle.». Dans son T projet, ce taux était de douze erreurs par out a commencé avec des données. page. Il a tout fallu vérifier à la main. Beaucoup trop nombreuses et trop complexes. En 1940, le jésuite Ro- berto Busa s’attelle à produire un index complet des 11 millions de mots re- trouvés dans les écrits théologiques de Tho- mas d’Aquin. Une entreprise gigantesque, «L’outil Ngram joue un rôle pour laquelle une vie entière ne suffirait pionnier pour les sciences pas. Mais le père Busa a une idée: se faire aider par une machine. Il trouve le soutien humaines.» de Thomas Watson, le fondateur d’IBM, et après trois décennies vient à bout de son projet: 56 volumes et 70 000 pages. L’In- dex Thomisticus est la première œuvre à permettre une recherche simple et rapide Martin Volk a alors développé un sys- dans les contenus d’un corpus entier. tème de correction en ligne qui a permis à des volontaires d’éliminer les erreurs, La montagne et le sport sous forme de jeu. Ce projet de science La numérisation s’immisce aujourd’hui citoyenne a séduit les membres du CAS. dans toutes les sciences humaines. «La «Grâce à leur aide, nous avons pu effectuer linguistique et la littérature sont les prin- plus de 250 000 corrections en six mois.» Le cipales intéressées, explique Martin Volk, corpus numérique est aujourd’hui presque professeur de linguistique computation- correct à 100%. Une fois numérisés, les nelle à l’Université de Zurich. Un accès nu- textes peuvent être facilement archivés et mérique à leurs données de recherche leur consultés, une chose «impossible pour des permet d’étayer ou d’invalider certaines documents anciens, rares ou difficilement hypothèses à l’aide de chiffres et de statis- accessibles», souligne le chercheur. tiques.» Dans le cadre de son propre projet de recherche Text+Berg, le spécialiste a nu- Freud, Einstein, Darwin mérisé les 250 volumes du Club Alpin Suisse Google Books est sans doute l’archive de ce (CAS) parus depuis 1864. «Ce matériel est genre la plus célèbre et la plus complète. ◂ Pages 15 et 16. Les deux nous une mine d’informations. Il montre com- Sa recherche en texte intégral permet de parlent de ce que nous mangeons: ment la façon d’envisager les montagnes parcourir les stocks des bibliothèques uni- un regard jeté dans notre frigo et une a évolué avec le temps. Décrites autrefois versitaires de H arvard, Stanford et New visualisation analytique des arômes. comme des objets d’exploration, elles sont York. Certaines bibliothèques européennes La couleur indique les catégories, vues aujourd’hui comme un terrain d’en- sont également intégrées, comme celle la taille des nœuds représente leur traînement sportif. Le terme ‹compétition› de l’Université d’Oxford ou la Bayerische fréquence dans les recettes, et les est, par exemple, beaucoup plus fréquent Staatsbibliothek. liens le nombre de composants que par le passé.» Ce gigantesque corpus a donné nais- aromatiques qu’ils partagent. A l’Université de Genève, des cher- sance en 2010 à Google Ngram, une appli- Images : Valérie Chételat (p. 15); cheurs veulent numériser une partie de cation web qui analyse la fréquence d’un Yong-Yeol Ahn (p. 16) la Bibliotheca Bodmeriana, une collection mot ou d’une suite de mots dans tous les Fonds national suisse – Académies suisses: Horizons no 105 17
Point fort Humanités numériques ouvrages dès 1800 scannés par Google. Elle l’impression que l’on a souvent lorsqu’on permet d’étudier des événements histo- regarde des SMS isolés, explique Elisabeth riques, comme l’abolition de l’esclavage, Stark. D’où la nécessité de disposer d’une mais aussi d’observer l’évolution linguis- grande quantité de données.» tique de certains mots au sein d’une langue, ou encore la popularité des personnalités: Accéder aux données les célébrités scientifiques que sont Freud, Les sciences humaines numériques per- Einstein ou Darwin apparaissent toutes mettent d’analyser la littérature et la très fréquemment dans la littérature, langue à l’aide de chiffres, qui ont toujours mais Freud est cité deux fois plus souvent été la marque des sciences exactes. Ils dé- depuis 1950. crivent les schémas quantitatifs et les rela- «Ngram n’est qu’un exemple de ce qu’on tions avec une précision dont les mots sont peut faire aujourd’hui avec les données rarement capables. La prochaine généra- culturelles numérisées», remarque son tion de chercheurs en sciences humaines créateur Jean-Baptiste Michel, chercheur travaillera sur des données, comme le font à l’Université Harvard. Les sciences hu- les bioinformaticiens depuis la fin du XXe maines numériques sont aujourd’hui in- siècle. «Ce domaine profitera de l’augmen- concevables sans Ngram, dont Martin Volk tation massive de la quantité de textes confirme le «rôle pionnier». numérisés, opine Martin Volk. Comme le séquençage du génome, qui a conduit à la La culture du SMS bioinformatique, la numérisation de notre La numérisation de la littérature n’est langue et de notre littérature fera inévi- qu’une approche d’analyse linguistique. tablement bientôt partie intégrante des «Avec nos ordinateurs et téléphones, nous sciences humaines.» saisissons plus de textes numériques que Des chercheurs comme Martin Volk jamais», souligne Elisabeth Stark, du Sémi- et Elisabeth Stark ne représentent que le naire de langues romanes de l’Université début d’une nouvelle ère dans la recherche. de Zurich. Rien qu’en 2013, plus de 100 mil- «Malheureusement, les ressources allouées lions de SMS ont été envoyés chaque jour aux sciences humaines numériques sont en Allemagne. «Ces textes ne sont presque limitées pour l’instant, en Suisse», déplore jamais imprimés, mais font partie de notre Martin Volk. «Dans toute l’Université de culture linguistique», poursuit la cher- Zurich, par exemple, il n’y a pas encore de cheuse. Avec son projet du Fonds national chaire d’humanités numériques alors qu’il suisse Sms4science, elle étudie les caracté- serait grand temps», renchérit Elisabeth ristiques linguistiques de la communica- Stark. Mais les deux chercheurs semblent tion par SMS en Suisse. trouver encore plus important de pou- voir accéder aux principaux réservoirs de données. «Des initiatives européennes d’envergure existent, mais la Suisse n’en fait malheureusement pas partie pour La langue raccourcie des l’instant», regrette Elisabeth Stark. Jean- Baptiste Michel abonde dans son sens: SMS obéit aux même lois que «Pouvoir accéder aux données constitue le celles du langage parlé. moteur essentiel!» Mirko Bischofberger est collaborateur scientifique du FNS. Pour accéder à ces données, Elisabeth J.-B. Michel et al., Quantitative Analysis of Culture Stark et ses collègues ont invité les utili- Using Millions of Digitized Books. Science, 2011 sateurs de portables en Suisse à envoyer une copie de leurs SMS à un numéro gra- tuit. «Nous avons ainsi pu collecter environ 26 000 messages.» Son équipe s’intéresse notamment aux ellipses linguistiques, au- trement dit aux omissions de mots, comme dans les expressions «Arrive bientôt» ou «T’appelle». Afin de découvrir pourquoi le sujet est omis dans ces exemples, les cher- cheurs ont analysé tous les SMS en français et en allemand. Résultat: ces omissions sont beaucoup plus rares qu’on ne l’ima- ginait et obéissent aux mêmes lois que le langage parlé quotidien. «Cela contredit 18 Fonds national suisse – Académies suisses: Horizons no 105
Fonds national suisse – Académies suisses: Horizons no 105 19
20 Fonds national suisse – Académies suisses: Horizons no 105
Point fort Humanités numériques Les archéologues du numérique Numériser les objets historiques Un processus difficile et coûteux, qu’il ne les préserve pas du déclin. Un faut répéter régulièrement – le pendant digital du t ravail des moines copistes du projet suisse veut sauver les données Moyen Âge. «La plupart des groupes de produites par la recherche. recherche n’ont pas les moyens de créer des outils stables, poursuit Lukas Rosen- Par Daniel Saraga thaler. L’idéal est de travailler avec eux dès le début pour élaborer une base de données durable qui puisse ensuite être facilement mise à jour et migrée.» Le mouvement de l’Open Research Data encourage les chercheurs à générer des ré- sultats scientifiques accessibles à chacun I et de manière interactive. Mais comme nternet n’oublie jamais», assènent les roduction scientifique. Paradoxalement, p toute machine, l’outil exige un entretien experts inquiets de voir notre vie privée ce type de recherche numérique peut s’avé- régulier. Un travail de l’ombre essentiel étalée sur le web. Mais rien n’est moins rer bien plus fragile qu’un résultat publié pour éviter de voir cette connaissance dis- sûr: le changement constant des sup- sous forme d’article.» paraître à jamais. ports de l’information n umérique et des formats des fichiers laisse derrière lui des Les copistes du IIIe millénaire Daniel Saraga est responsable de la communica- montagnes d’informations qui, inexorable- Le directeur des Digital Humanities Lab à tion scientifique du FNS. ment, deviennent illisibles. Livrées à elles- l’Université de Bâle a pu sauver l’une des mêmes, elles sont condamnées à l’oubli. plus importantes bases de données consa- Final report for the pilot project «Data and Service Cette problématique touche de plein crée à la mythologie grecque, le Lexicon Center for the Humanities» SAGW, 2015 fouet les résultats scientifiques, exprimés Iconographicum Mythologiae Classicae, Le patrimoine culturel à l’ère numérique, Nike de plus en plus souvent sous forme de bases qui s’est arrêté en 2009, après trente ans de Bulletin, juin 2014 de données. Car celles-ci vieillissent très développement: «Elle était complètement http://openresearchdata.ch/ rapidement: les langages de programma- hors service, et l’entreprise qui l’avait pro- tion se révèlent obsolètes et les systèmes grammée était en faillite, poursuit Lukas d’exploitation ne sont plus compatibles Rosenthaler. Nous avons même dû pirater avec le nouveau serveur. le site, car les mots de passe avaient dispa- «C’est un vrai problème, souligne L ukas ru. Notre travail ressemble parfois à une Rosenthaler, responsable du Centre de sorte d’archéologie du numérique.» Ces Sauvegarder le sauveur données et services pour les sciences hu- efforts redonnent une seconde vie aux ré- maines (DDZ), un projet consacré à assurer sultats de la recherche. L’Université Har- Voué à la préservation des archives numé- la pérennité des résultats scientifiques en vard, par exemple, s’intéresse aujourd’hui à riques, le Centre de données et services pour sciences humaines (voir «Sauvegarder le intégrer le Lexicon dans son commentaire les sciences humaines (DDZ) est lui-même sauveur»). Il est très rare que les chercheurs d’Homère, en utilisant les «linked open en danger. «Nous nous battons depuis continuent à maintenir les infrastruc- data», une composante du web 3.0 qui per- 2008 pour mettre en place une plateforme tures numériques une fois un projet – et met de relier les informations en ligne de stable, déclare Markus Zürcher, secrétaire son financement – terminé. Une base de manière directe et dynamique. général de l’Académie suisse des sciences données inaccessible est inutilisable, et Avec sa petite équipe, l’ancien physicien humaines, qui a lancé le projet. Toutes les ne pas l’entretenir revient à détruire une s’est appuyé sur la technologie sémantique personnes concernées soutiennent cette pour créer une plateforme générique ca- plateforme. La seule chose à régler, c’est le pable de structurer des données provenant financement.» ◂ Pages 19 et 20. La cartographie de plateformes très variées. «J’estime que Le DDZ reste un projet pilote qui touche à créé une forme de réalité augmentée nous pouvons traduire 99% des bases de son terme. «Nous avons déposé en mars en ajoutant des données à la géogra- données utilisées en sciences humaines, 2015 une demande portant sur 2 millions phie. Ces vues globales permettent et même certains projets en biologie. En de francs pour 2017–2020 auprès du SEFRI d’identifier rapidement des informa- trois ans, nous avons migré une trentaine (Secrétariat d’Etat à la formation, à la tions cachées, comme ici l’explosion de projets, de la mythologie grecque à une recherche et à l’innovation). D’ici là, nous d’achats alimentaires avant Pâques collection de photographies historiques de sommes prêts à assurer le financement et celle de la restauration sur la Cos- montagne.» jusqu’en 2017, car une interruption du ta Tropical au sud de l’Espagne. Le DDZ suit le concept de l’Open projet serait très néfaste.» Par comparaison, Images: Valérie Chételat (p. 19); Archival Information System: copier les quelque 30 millions sont dépensés annuel- MIT Senseable City Lab – Carlo Ratti, Director – données régulièrement et les retrans- lement pour les bases de données dans les Pedro Cruz: Visualization (p. 20) crire dans un nouveau format plus actuel. sciences humaines. Fonds national suisse – Académies suisses: Horizons no 105 21
Point fort Humanités numériques «Il ne s’agit pas d’une révolution» Les humanités numériques ne constituent de certains mots fonctionnels. La répar- que des nouvelles méthodes, mais elles tition statistique des fréquences de mots dans ses récits permet d’objectiver la par- permettent de poser un nouveau type de ticularité de son style. Elle nous dit aussi questions. Gerhard Lauer est un pionnier quelque chose sur l’époque. Nous n’étudions plus seulement le canon littéraire, comme des techniques informatiques pour l’analyse «Les Affinités électives» de Goethe, mais les littéraire qui se décrit comme un conservateur. nombreux livres qui étaient populaires à la Propos recueillis par Urs Hafner même période. L’histoire culturelle de ce qui était lu passe ainsi au premier plan, et plus seulement les belles lettres. Il s’agit de premiers éléments, pas encore de connais- sances qui chamboulent tout. La nouveau- té, ce sont les méthodes. Gerhard Lauer, que comprenez-vous par le terme d’humanités numériques? L’analyse historico-herméneutique Quelque chose de très pratique: l’utilisa- n’est-elle pas supérieure au comptage tion de méthodes informatiques pour réali- de mots? ser des éditions numériques et analyser de Tel est peut-être encore le cas, mais cela gros volumes de textes de manière plutôt change au fur et à mesure des résultats quantitative. que nous obtenons. Nous identifions toujours plus clairement certains sché- Les humanités numériques ont-elles mas textuels à partir desquels nous pou- modifié votre recherche? vons déduire l’évolution de l’aptitude hu- Oui, mais pas abruptement. Elles com- maine à raconter. On peut ainsi aborder de mencent seulement à transformer la re- nouvelles questions, notamment la diffé- Notre héritage culturel ne devrait cherche en sciences humaines, dans la me- rence entre narration européenne et nar- pas être défini par Google, soutient sure où elles étendent peu à peu le spectre ration asiatique. Gerhard Lauer. des méthodes et des questions. Nous en- treprenons l’analyse de la littérature de Comment procédez-vous lorsque vous manière quantitative, par exemple celle du cherchez à savoir ce que les gens lisaient «Werther» de Goethe ou les récits de Kafka. en Europe au début du XIXe siècle? Du côté des étudiants, la demande pour Nous évaluons des sources et des méta ces méthodes augmente, et j’accompagne données recueillies à partir de différents à présent les premiers travaux de bachelor catalogues de bibliothèques. De là, nous dans ce domaine. pouvons déduire quels livres étaient impri- més, achetés, empruntés et probablement Traditionnellement, le texte se trouve lus par les gens. Ou alors, nous utilisons au cœur des sciences humaines. Celles- l’outil Ngram Viewer de Google qui permet ci analysent son sens manifeste et de parcourir près de cinq millions de livres latent, et ouvrent leurs conclusions à en différentes langues. la discussion sur un mode narratif et argumentatif. Les humanités numériques L’analyse Ngram est pourtant sélective: passent à côté de cette dimension. les critères en fonction desquels Google A première vue, vous avez raison: ce qu’elles numérise ou non certains livres restent font avant tout, c’est compter des mots. inconnus. Mais la répartition de ces derniers dans les C’est vrai. Les corpus avec lesquels nous tra- textes dit bel et bien quelque chose sur ces vaillons n’ont souvent pas été constitués de mêmes textes. Le type de mots utilisé par manière systématique et ne sont pas équili- un auteur nous en apprend beaucoup sur brés statistiquement. Google Books est par- lui. On peut penser que l’emploi d’articles ticulièrement problématique, car Google et de pronoms ne dit pas grand-chose, mais a numérisé au hasard des bibliothèques c’est le contraire. entières. Ce n’est pas un corpus. Cette en- treprise définit ainsi ce qui constitue notre Quelles connaissances avez-vous pu héritage culturel. Il incombe donc aux ainsi générer? universités et aux bibliothèques de s’enga- Nous nous intéressons par exemple au ger pour que l’héritage culturel ne soit pas nombre de mots courts et de mots longs privatisé, mais qu’il puisse être évalué de qu’utilisait Kafka, comparé à d’autres au- façon critique. En sciences humaines, nous teurs de son époque, ou encore à son usage faisons trop peu face à ce défi culturel. 22 Fonds national suisse – Académies suisses: Horizons no 105
Les adeptes des humanités numériques «Les sciences humaines se parlent souvent de révolution. Vous modernisent, mais à très aussi? C’est la numérisation qui est une révo- petits pas.» lution, pas les humanités numériques. Les sciences humaines se transforment, comme la chimie, la physique, la médecine et la biologie se sont transformées lors- qu’elles ont intégré certaines méthodes informatiques. La biologie a profondément de pratiquer l’analyse littéraire. Bien en- changé avec le recours à l’ordinateur, mais tendu, dans un champ nouveau, presque sans rien perdre en tant que discipline. Il se tout le monde se connaît, et un esprit produira la même chose avec les sciences d’équipe émerge. J’ai des contacts aussi humaines. L’archéologie et les sciences du dans les centres suisses, à Lausanne, à Bâle langage ont déjà franchi le pas. Les huma- et à Berne. Leur méthodologie fait aussi nités numériques représentent pour ainsi que les humanités numériques sont plus dire un sentiment de révolution: quelque collaboratives que les sciences humaines chose de nouveau arrive, notamment des ne le sont d’habitude. chiffres et des statistiques, et de nom- breuses disciplines ne savent pas encore Les humanités numériques se comment l’appréhender. soucient-elles suffisamment de savoir, par exemple, dans quelle mesure l’utilisation du numérique modifie le statut du texte? Là, il y a des déficits, car les questions fon- «Nous ne disposons pas damentales et le travail pratique n’ont encore de méthodologie souvent pas encore été réunis, alors qu’on débat beaucoup de critique d’algorithmes confirmée.» et du texte numérisé. Mais il ne faut pas oublier que nous n’en sommes qu’au début, que nous évoluons souvent en marge, et que nous ne disposons pas encore de mé- Les sciences humaines prennent-elles thodologie confirmée. pour modèle les sciences naturelles, qui sont habituées aux méthodes Les sciences humaines dans l’ensemble quantitatives, dans l’espoir d’obtenir évoluent en marge. davantage de fonds de recherche? Si elles continuent comme elles l’ont fait Il faut distinguer entre deux intérêts jusqu’ici, leur avenir ne sera pas brillant. contra dictoires. D’un côté, la politique Leur situation est difficile. Dans les pays d’encouragement de la recherche s’oriente anglo-saxons, elles ne reçoivent pratique- en fonction des tendances vers ce qui pro- ment plus de fonds publics et doivent se met la prochaine nouveauté. Actuellement, financer presque intégralement par les les humanités numériques sont considé- écolages. rées comme un domaine prometteur, on y investit donc de l’argent. D’un autre côté, il Voyez-vous les humanités numériques s’agit d’un secteur où il est difficile de trou- comme une bouée de sauvetage? ver un emploi dans les facultés établies. Non. Dans le meilleur des cas, comme une Celles-ci font souvent preuve de beaucoup partie de la solution. Indépendamment de retenue et ont plutôt tendance à engager des méthodes numériques, les sciences un chercheur qui correspond à la concep- humaines doivent répondre à une grande tion traditionnelle des sciences humaines. question: celle de savoir ce qu’elles veulent Ces dernières se modernisent, mais à très enseigner à l’avenir. Et ce sans perdre de Un penseur non conventionnel petit pas. Les choses sont différentes pour vue les changements fondamentaux que la les bibliothèques et l’édition. modernisation numérique exige de nous. Les humanités numériques constituent un point fort des travaux de Gerhard Lauer, qui Avez-vous le sentiment d’appartenir à L’historien Urs Hafner est journaliste scientifique enseigne la philologie allemande à l’Univer- une avant-garde? et ancien rédacteur en chef d’Horizons. sité de Göttingen (D). Il a récemment publié Non. On m’a attribué ce rôle – ainsi qu’à des travaux consacrés à Thomas Mann et d’autres – sans que je l’aie cherché, car je Joane K. Rowling, et a étudié les réactions de suis plutôt conservateur dans ma manière la pupille chez le lecteur. Fonds national suisse – Académies suisses: Horizons no 105 23
Vous pouvez aussi lire