Digital humanities: des chiffres et des lettres . 10 - horizons
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
cher
A détaguide
Notre ctivités
a
de 20 tifiques
scien
Digital humanities: des chiffres et des lettres ...... 10
Et voici le bébé Une mouche pour La mer
à trois parents ........ 34 la vie éternelle ....... 36 de plastique ........... 44A la découverte d’homo digitalis Avec les humanités numériques, les sciences humaines adoptent elles aussi des outils informatiques puissants: digitalisation, bases de données, analyses statistiques, cartographie. Cette évolution leur permet bien entendu de travailler de manière plus efficace, mais également d’ouvrir de nouveaux champs de recherche. Il s’agit avant tout d’un nouvel outil, pas d’une baguette magique. Les chercheurs le savent bien: les corrélations découvertes dans une tranche de big data ne fournissent qu’une indication et n’apportent ni preuve, ni explication. Donner un sens à ces informations, y découvrir une causalité exigera toujours de passer par une interprétation qualitative et subjective de la situation. Comme l’écrivait Bruno Latour en 1993, les données ne tombent pas du ciel mais sont toujours «obtenues». Elles peuvent paraître objectives, mais ne sont, en fait, jamais neutres. Un point important, qui semble parfois échapper aux autorités, avides de recettes objectives et indiscutables. Cette mue remet en question les pratiques des sciences humaines, car tout outil modifie notre manière de percevoir le monde. Devant ces algorithmes tout-puissants, les chercheurs devront soigneusement réfléchir à la façon de préserver leur appréciation de la complexité et de l’ambiguïté. L’importance de la mue numérique des sciences humaines va au-delà de l’efficacité de la recherche. Car ce sont elles qui devront étudier homo digitalis et comprendre les bouleversements provoqués par le numérique sur la société dans son ensemble: redéfinition des rapports sociaux, abandon de la sphère privée, nouvelles manières d’assimiler l’information. Pour y parvenir, les sciences humaines devront absolument s’approprier ces nouveaux instruments. Car on ne comprend bien un phénomène que si l’on a pu l’éprouver soi-même. Daniel Saraga, rédacteur en chef
Sommaire
25
Aurel Märki
Maximilian Schich and Mauro Martino
Point fort Humanités numériques Science et politique
10 Humanités 2.0
24
Le plafonds de verre
Une informaticienne révèle les facteurs
invisibles qui freinent la carrière
académique des femmes.
Les méthodes numériques bouleversent les 25
Un tour de Suisse scientifique
sciences humaines. Elles permettent de poser Notre guide vous propose 20 activités
estivales aussi bonnes pour vos sens que
de nouvelles questions et redéfinissent les pour votre cerveau.
pratiques de recherche. Où nous emmènent 29
«La valeur la plus importante
les Digital Humanities? d’une haute école est l’autonomie
stratégique»
Le recteur de l’Université de Bâle Antonio
13 Loprieno donne son avis sur les rankings
L’historien et l’algorithme et le sponsoring privé.
17
Des nombres pour décrire le langage
21
Sauver les données de l’oubli
22
«Les humanités numériques ne sont pas une révolution»
◂ Couverture. Tinder en 1900. «Chère Mademoiselle! Vous envoie mes ◂ Couverture intérieure. Comment parle la Suisse en 2015? Des chercheurs
cordiales salutations, ainsi qu’à Madame votre mère et à votre frère.» des universités de Zurich, Berne et Neuchâtel ont étudié des messages sur
L’histoire ne dit pas si le signataire finit par passer l’anneau au doigt WhatsApp et élaboré un nuage de mots pour Horizons. La fréquence est
de la destinataire. indiquée par la couleur et la taille. Le mot le plus utilisé en français: «pas».
Photo: Keystone/Interfoto/Pulfer Image: Simone Ueberwasser, whatsup-switzerland.ch
4 Fonds national suisse – Académies suisses: Horizons no 10534 40 44
Wikimedia Commons
Keystone/Science Photo Library/Professors P. Motta & T. Naguro
Keystone/AP Photo/Thanassis Stavrakis
Biologie et médecine Culture et société Environnement et technique
34 40 44
Un père, deux mères «Il faut démocratiser Un océan de plastique
Le Royaume-Uni autorise le don de l’Union Européenne» D’innombrables déchets de plastique
mitochondries, une technique de Les succès des mouvements euro s’accumulent dans les cinq gyres
procréation médicalement assistée sceptiques constituent un signal océaniques.
fortement débattue. Comment réagit d’alarme, explique le politologue Yannis
la Suisse? Papadopoulos. 46
De Dübendorf à Washington
36 43 Rita Thót transforme l’énergie solaire en
Les mouches survivantes Des bébés mignons sous la loupe hydrogène. La physicienne de l’Empa a
Pour découvrir les secrets de la longévité, La naissance des attractions touristiques été désignée l’une des «100 Leading Global
les chercheurs se penchent sur les gènes Allaité par une louve Thinkers» par Foreign Policy.
des insectes.
48
38 L’art de la déformation
La pollution intérieure Des cellules photovoltaïques vivantes
Les microparticules sont aussi présentes Des tsunamis dans les Alpes
dans nos maison. Une étude suisse veut
mieux les quantifier.
39
La vie sociale des bactéries
Les renards domestiqués s’adaptent
Contrer les pneumonies
En image Lieu de recherche Verbatim
6 32 50
A la quête du neutralino En Zambie, auprès des poissons Remplir son rôle de scientifique
d’aquarium
Débat En direct du FNS et des Académies
Comment ça marche?
8 51
Les universités doivent-elles s’enrichir 49 La ville en banlieue
avec leurs spin-offs? La navette spatiale suisse Soar
Fonds national suisse – Académies suisses: Horizons no 105 5Au-delà du Higgs
L’accélérateur de particules géant du
CERN, le LHC, a redémarré en avril
2015. Son but: pour chasser de nou-
velles particules avec 60% d’énergie
supplémentaire.
L’image ci-contre montre les jets de
particules créés lors d’une collision.
Les courbes dans la région grise sont
reconstruites par ordinateur, à partir
d’informations livrées par un détec-
teur de 80 millions de pixels placé
au centre. Les courbes marquées en
rouge et vert sont en accord avec les
mesures effectuées par les calori-
mètres (les anneaux vert et rouge),
des détecteurs qui arrêtent certaines
particules et mesurent leur énergie.
«Cet événement n’est pas excep-
tionnel en soi, explique le physicien
Steven Goldfarb. Le Modèle standard
prédit qu’il survient de temps en
temps. Mais l’observer avec une pro-
babilité accrue fournirait une indica-
tion en faveur de l’une des variantes
de la supersymétrie.» Cette théorie a
été développée pour répondre à des
questions ouvertes telles que l’unifi-
cation des forces fondamentales ou
la matière sombre, qui constitue 80%
de la masse totale de l’univers.
Le trait gris discontinu à droite est
l’indication d’une particule man-
quante: soit un neutrino, soit un
neutralino prédit par la supersymé-
trie, soit encore une autre particule
candidate pour la matière sombre. Le
boson de Higgs a bien été observé en
2012, mais l’univers n’a pas encore
livré tous ses mystères. dsa
Image: ATLAS Experiment © 2014 CERN
Fonds national suisse – Académies suisses: Horizons no 105 7Débat
Valérie Chételat (photomontage)
Les universités
doivent-elles
s’enrichir avec
leurs spin-offs?
Des dizaines de start-up sont
lancées chaque année en Suisse
pour valoriser des recherches
scientifiques financées en très
grande partie par l’Etat. Les
universités qui les ont soutenues
devraient-elles s’enrichir en cas
de succès commercial?
Oui
affirme le
politicien
Jean-François
Steiert.
Au cours des vingt dernières années, en- ’impôts exagérées, des fonds supplémen-
d est la transparence. Si les hautes écoles
viron un millier d’entreprises, le plus sou- taires doivent pouvoir être générés de cette veulent garder la confiance du contri-
vent de petite taille, a contribué au succès manière et soutenir les jeunes chercheurs buable, elles doivent déclarer combien
de la Suisse. La majorité d’entre elles sont dans la valorisation économique de leurs d’argent est généré par leurs start-up pros-
prospères, même si les investisseurs en- innovations. pères. Cette information, elles la doivent
clins à prendre des risques sont plus rares au contribuable qui, à raison, veut savoir
en Suisse que par exemple aux Etats-Unis. si ses deniers sont bien investis dans la re-
La plupart du temps, les spin-offs sont cherche, un domaine capital pour la Suisse.
soutenues par l’argent du contribuable, au
niveau des infrastructures, des réseaux so- «L’investisseur public doit Jean-François Steiert (PS) est conseiller national
ciaux, des bourses ou des services de coa- pouvoir exiger une partie depuis 2007 et membre de la Commission de la
ching des hautes écoles. L’objectif de ce science, de l’éducation et de la culture.
genre d’investissements publics est avant du bénéfice.»
tout d’encourager l’emploi et la recherche. Jean-François Steiert
Grâce au soutien de fonds publics, ces
innovations génèrent par le biais de ventes
ou de brevets des bénéfices importants
de l’ordre de dizaines ou de centaines de Lors de la vente des brevets, il ne s’agit ni
millions de francs. L’investisseur public de viser le rendement maximal, ni de préle-
doit pouvoir exiger une partie de ces bé- ver des bénéfices selon une clé unique. Les
néfices. Non pas pour permettre à l’Etat hautes écoles ont besoin d’une marge de
ou aux hautes écoles de s’enrichir, mais manœuvre pour optimiser le prélèvement.
pour réinvestir ces fonds dans l’encou- D’un côté, il faut que la création et la direc-
ragement de la prochaine génération de tion de start-ups restent attrayantes. De
chercheurs. A l’heure où la Confédération l’autre, il convient de réinvestir de manière
et les cantons mettent en place des pro- adéquate dans la prochaine génération de
grammes d’économies en raison de baisses chercheurs. Ce qui fait défaut, aujourd’hui,
8 Fonds national suisse – Académies suisses: Horizons no 105Non
répond Hervé
Lebret, gérant d’un
fonds de place-
ment de l’EPFL.
Lorsque Marc Andreessen lança Netscape pense qu’il ne doit pas l’être. Néanmoins, analyse des termes de licences publiques
en 1993, l’un des premiers browsers du Web, un retour indirect existe déjà: d’abord sous d’une trentaine de start-up.1 Elle montre
l’Américain de 22 ans préféra repartir de la forme de l’impôt et, plus important en- que les universités prennent une participa-
zéro plutôt que de signer une licence avec core, à travers les centaines de milliers tion moyenne de l’ordre de 10% à la création
l’Université de l’Illinois, dont il jugeait les d’emplois créés par les start-up. Leur valeur de la start-up, qui se dilue à 1–2% après les
conditions abusives. Au contraire, l’Uni- est, au final, bien supérieure aux dizaines premiers financements.
versité de Stanford entretint des relations de millions de dollars rapportés chaque Il est impossible de connaître à l’avance
moins tendues avec les fondateurs de Goo- année aux meilleures universités améri- le potentiel commercial d’une technologie.
gle, en prenant une participation modeste caines par leurs licences. Il faut avant tout faire en sorte que celui-ci
de 2% (qui lui rapporta 336 millions de ne soit pas pénalisé par des termes de li-
dollars six ans plus tard lors de l’entrée en cence excessifs. Des conditions abusives
bourse de la société). La même université peuvent démotiver l’entrepreneur avant
ne demanda rien à Yahoo!, jugeant que les «Des conditions abusives même qu’il ne se lance et décourager les
fondateurs avait développé le site sur leur investisseurs. Et ainsi tuer la poule dans
temps libre. Quelques années plus tard, peuvent démotiver l’œuf.
l’un des fondateurs de Yahoo! fit un don l’entrepreneur avant même
de 70 millions de dollars à Stanford – alors Hervé Lebret est membre de la Vice-présidence
qu’Andreessen, lui, ne veut plus entendre qu’il ne se lance.» pour l’innovation et la valorisation de l’EPFL et
parler de son alma mater. Hervé Lebret directeur d’Innogrant, un fonds d’innovation de la
Ces exemples montrent bien comment haute école lausannoise.
les rapports entre universités et entreprises
peuvent se tendre lorsqu’elles ne partagent 1 http://bit.ly/lebrstart
pas la même perception de la valeur d’un Comment alors définir la juste rétribu-
transfert de connaissances. Ce dernier est tion pour les universités? Le sujet est sen-
souvent gratuit lorsqu’il s’agit de forma- sible, mais aussi mal compris, notamment
tion, mais lorsqu’il est question de création à cause d’un manque de transparence des
d’entreprises, l’écrasante m ajorité des gens différents acteurs. En 2013, j’ai publié une
Fonds national suisse – Académies suisses: Horizons no 105 9Point fort Humanités numériques
Des chiffres
et des lettres
Les sciences humaines
adoptent elles aussi les
technologies numériques.
Ces outils offrent un nouveau
regard sur notre culture et
obligent les chercheurs à
redéfinir leur discipline.
10 Fonds national suisse – Académies suisses: Horizons no 105Fonds national suisse – Académies suisses: Horizons no 105 11
12 Fonds national suisse – Académies suisses: Horizons no 105
Point fort Humanités numériques
ces données, un algorithme estime avec
une certaine probabilité l’emplacement des
frontières à telle ou telle époque.
Ces outils numériques ne dispensent
Le numérique pas le chercheur de son travail de terrain,
souligne Sylvian Fachard. Une fois les pré-
entre dans l’histoire
dictions livrées par le modèle, il remet son
chapeau d’archéologue et cherche des in-
dices pour les confirmer ou les infirmer. «Il
est nécessaire d’interpréter toutes les don-
nées afin de produire un résultat pertinent.
Historiens et archéologues Le numérique génère encore davantage
apprennent à apprivoiser les outils d’informations qu’il faut articuler entre
elles. Cela réclame un niveau d’analyse plus
informatiques. Une évolution complexe.»
inéluctable qui a le potentiel L’histoire collective
de bouleverser ces disciplines. Autre profonde mutation induite par le nu-
Par Fabien Goubet mérique, le changement d’échelle. «Dans la
culture digitale, on passe du solitaire au col-
lectif, comme l’ont fait les sciences dures,
note Claire Clivaz. Les articles sont signés
par des collaborations de chercheurs et non
L
plus par des auteurs uniques.»
e monde se numérise et les sciences La composante temporelle est également
humaines n’y échappent pas. Elles affectée, ajoute Sylvian Fachard: «Nous
aussi se métamorphosent sous l’in- partons en fouilles équipés de tablettes
fluence des ordinateurs et des al- tactiles qui nous permettent de centraliser
gorithmes. Il ne s’agit évidemment pas en temps réel les données récoltées. Nous
de simples outils de traitement de texte pouvons adapter notre stratégie au jour le
ou de messagerie, mais bien de profondes jour. Cela nous apporte une souplesse in-
mutations qui s’immiscent dans toutes croyable.» «Le rythme de la science évolue,
les étapes de production des savoirs, de la ajoute Claire Clivaz. La production est assu-
numérisation des sources à leur analyse. rée en continu, notamment avec les blogs
Emergence de nouvelles pratiques, appa- sur lesquels s’expriment les chercheurs.»
rition de nouveaux métiers, adaptation
nécessaire des formations universitaires:
les humanités numériques ont tout pour
rebattre les cartes des sciences humaines.
Le terme «digital humanities» n’est ap-
paru officiellement à l’écrit qu’en 2004, «Il n’y a plus un texte unique
précise Claire Clivaz, professeure invitée dans une version donnée,
au Laboratoire de culture et humanités
digitales de l’Université de Lausanne: «On mais une véritable généalogie
parlait auparavant de ‹humanities and de toutes les versions.»
computing› comme si ces deux notions se
faisaient face.» Le changement sémantique
montre qu’elles sont aujourd’hui intime-
ment liées.
L’ordinateur dessine les frontières Claire Clivaz étudie les manuscrits du
Les travaux de Sylvian Fachard, de l’Uni- Nouveau Testament, et le numérique per-
versité de Genève, illustrent bien les nou- met de mettre enfin la main sur une par-
velles possibilités offertes par le numé- tie des quelque 5800 manuscrits rédigés en
rique. Ce spécialiste de l’archéogéographie grec ancien. Mais le numérique change éga-
veut déterminer le tracé des frontières des lement la manière de penser ce qu’est un
différentes communes de l’Attique, la ré- document historique. «Il n’y a plus un texte
gion entourant Athènes, entre le Xe et le unique dans une version donnée, mais une
◂ Pages 11 et 12. Représenter la Ier siècle av. J.-C. «Les quelques rares textes véritable généalogie de toutes les versions,
vie de Newton, de Washington et qui nous sont parvenus ont tous été analy- note la chercheuse. Le texte devient par
d’autres géants de l’histoire par un sés au début du XXe siècle et ne permettent conséquent multiforme. Cela change com-
portrait ou sur une carte? Une équipe pas de replacer les frontières sur une carte», plètement notre état d’esprit: avant, on
emmenée par Dirk Helbing, d’ETH explique Sylvian Fachard. Face à cette im- cherchait la version la plus ancienne à tout
Zurich, a relié les lieux de naissance passe, le chercheur recourt à la modélisa- prix, tandis qu’on perçoit maintenant un
et de mort de 120 000 personnalités tion spatiale de la région. Il répertorie en texte comme évoluant dans une histoire de
au cours des 2600 dernières années fonction de l’espace et du temps tous les ob- la lecture.»
pour illustrer les déplacements des jets, ruines et autres tombeaux découverts Citant l’historien du livre Roger Char-
centres intellectuels. lors de fouilles, et croise ces informations tier, la chercheuse insiste sur le fait que
Images: Wikimedia Commons, Wellcome Library avec des données géographiques telles que le support de l’information modèle notre
(p. 11); M. Schich et M. Martino (2014) (p.12) la topographie du terrain. En fonction de façon de penser. Et d’ajouter: «Plus encore
Fonds national suisse – Académies suisses: Horizons no 105 13Point fort Humanités numériques
que l’imprimerie, la révolution numérique Gubler, directeur adjoint du RAG. La nature sociologues, informaticiens, statisticiens.
est la rupture la plus importante depuis numérique de notre index rend également «Nous avons besoin de profils capables de
le passage du rouleau de parchemin au possible l’établissement de davantage de faire le lien entre tous ces univers», sou-
codex (un cahier composé de pages manus- liens avec d’autres projets de recherche.» ligne Bella Kapossy, du Laboratoire de
crites, ndlr)». cultures et humanités digitales de l’Uni-
Big data du passé versité de Lausanne. Toute évolution d’une
Générer des hypothèses La puissance des outils numériques peut discipline amène une redéfinition poten-
Cette rupture est notamment marquée par faire rêver, mais des promesses empha- tielle de son identité. Comme le dit Claire
un changement de relation entre les histo- tiques sont aussi susceptibles d’attiser les Clivaz: «L’un des défis posés par cette révo-
riens et leurs sources. Martin Grandjean, critiques. Venice Time Machine, un projet lution est de savoir jusqu’où collaborer avec
un doctorant en histoire à l’Université de médiatique de l’EPFL,ambitionne de recréer des personnes issues d’autres disciplines
Lausanne, planche sur les archives de la la Cité des Doges des douze derniers siècles sans perdre notre identité.»
Société des Nations afin de comprendre à partir des archives d’Etat vénitiennes.
comment les chercheurs allemands actifs La première étape consistera à numériser Fabien Goubet est journaliste scientifique et écrit
durant l’entre-deux-guerres ont réussi à les millions de documents (quelque 80 ki- pour Le Temps.
revenir au premier plan européen malgré lomètres d’archives) existants. «Analyser
leur mise à l’écart. Il élabore pour cela une autant de documents serait tout bonne-
cartographie spatiotemporelle de leur cor- ment impossible pour des êtres humains»,
respondance. avance Frédéric Kaplan, chef d’orchestre
du projet et professeur au Laboratoire d’hu-
manités digitales de l’EPFL.
Ce seront donc des machines qui devront
déchiffrer les écritures manuscrites et en
extraire des données telles que le prix de
«L’un des défis est de savoir la cannelle importée d’Orient, le salaire des
jusqu’où collaborer avec des condottieri ou encore la liste des apprentis
maçons à une époque donnée. «En résumé,
personnes issues d’autres ce projet, c’est faire du big data du passé
disciplines sans perdre notre pour créer les Google Maps et le Facebook
de Venise», lance Frédéric Kaplan. Il com-
identité.» pare son projet au séquençage du génome
humain, «une grande infrastructure qui
permettra d’aider de nombreux chercheurs
par la suite». Avec ses partenaires vénitiens,
le chercheur espère même mettre sur pied
«Le contenu des lettres m’intéresse une visite touristique virtuelle de la Séré-
moins que les métadonnées, à savoir qui nissime sur smartphone.
a écrit à qui et à quelle date», explique le Cette vision grandiose attise le scepti-
chercheur. Il esquisse ensuite des repré- cisme, voire la méfiance, de certains histo-
sentations schématiques des métadonnées riens qui préfèrent ne pas être cités. Leur
dans l’espoir de faire émerger des informa- critique: le projet manquerait de cadrage
tions qui auraient jusqu’ici échappé aux et nécessiterait des approches historiques
historiens. Mais aussi riche que puisse être complémentaires. Mais Frédéric Kaplan
sa cartographie, elle ne représente pas un reste sûr de lui: «Nous publierons bientôt
résultat en tant que tel: «La visualisation de une modélisation complète d’un premier
données me donne des idées et me suggère quartier de Venise, celui du Rialto.»
des hypothèses. Comme n’importe quel Les universités suisses en mutation
historien, je dois ensuite les vérifier en me Garder son identité
plongeant dans les archives.» Les humanités numériques resteront-elles Onze ans après son apparition, l’expression
Ces visualisations de données com- de simples outils dans la trousse des his- «digital humanities» commence à se faire
plexes se trouvent également au cœur toriens, ou annoncent-elles l’avènement une place dans le cursus académique. En
d’un projet de recherche des universités de d’une discipline à part entière? «C’est ce Suisse, étudiants et chercheurs ont à leur
Berne et de Giessen, le Repertorium Aca- que je pense, mais cette question est su- disposition des cours, des ateliers et des
demicum Germanicum (RAG). Aux racines jette à débat au sein de la communauté», séminaires ponctuels. Depuis cette année,
de celui-ci, une base de données sur 50 000 répond Frédéric Kaplan, alors que Sylvian la Faculté des lettres de l’Université de
savants et intellectuels ayant fréquenté les Fachard réaffirme «rester un archéologue Lausanne (UNIL) propose également 30
universités du Saint-Empire romain ger- avant tout». Claire Clivaz nuance: «Pour crédits de spécialisation en digital humani-
manique entre 1250 et 1550. En principe, moi, ce n’est ni l’un ni l’autre. Je vois plutôt ties au niveau master.
rien n’interdirait d’établir ce «who’s who» les humanités numériques comme un label Le réseau européen Dariah répertorie tous
sans outil numérique, mais il serait bien de transition, car en définitive les sciences les cours disponibles, sur une carte en ligne,
plus difficile d’interpréter les résultats. Les humaines et sociales seront numériques bien évidemment. Une douzaine d’en-
chercheurs ont choisi de les présenter sur quoi qu’il arrive. Si bien que les adjectifs trées suisses y figurent, réparties entre les
une carte en fonction du temps, une visua- ‹numérique› et ‹digital› pourraient bien dis- universités de Genève, Lausanne, Berne et
lisation originale qui, là aussi, peut faire paraître d’eux-mêmes, par évidence.» Bâle, partenaires de cette infrastructure. Le
naître des nouvelles hypothèses. «Cet outil Les passerelles que lance le numérique paysage helvétique va encore évoluer dans
nous permet de repenser le rôle des uni- ne sont pas toujours faciles à fréquen- les mois à venir, notamment avec un projet
versités médiévales dans une perspective ter. Dans les couloirs de ces nouveaux de Master interfacultaire en humanités
beaucoup plus large, commente Kaspar centres se croisent désormais historiens, digitales à l’UNIL.
14 Fonds national suisse – Académies suisses: Horizons no 105Fonds national suisse – Académies suisses: Horizons no 105 15
16 Fonds national suisse – Académies suisses: Horizons no 105
Point fort Humanités numériques
exceptionnelle de 150 000 œuvres litté-
raires recouvrant trois millénaires en 80
langues. On y trouve, entre autres, le plus
ancien manuscrit de l’Evangile de Jean
200 ans de littérature datant du IIe siècle ainsi que les originaux
des contes des frères Grimm.
en 0,4 seconde Le citoyen à l’aide
Mais numériser des ouvrages est une tâche
pénible. «Il faut couper les livres à la main
avant de scanner chaque page séparé-
La lecture lente a vécu: des ordinateurs ment, détaille Martin Volk, qui a numérisé
avalent des millions de livres en un rien dans son projet plus de 120 000 pages. On a
alors uniquement des images, mais pas de
de temps. Et nous proposent leur propre texte.» La reconnaissance des textes est ef-
analyse. Par Mirko Bischofberger fectuée par des programmes qui identifient
les lettres dans les images et les transfor-
ment en mots. «Mais le taux d’erreurs reste
encore assez élevé, notamment avec des
écrits anciens du XIXe siècle.». Dans son
T
projet, ce taux était de douze erreurs par
out a commencé avec des données. page. Il a tout fallu vérifier à la main.
Beaucoup trop nombreuses et trop
complexes. En 1940, le jésuite Ro-
berto Busa s’attelle à produire un
index complet des 11 millions de mots re-
trouvés dans les écrits théologiques de Tho-
mas d’Aquin. Une entreprise gigantesque, «L’outil Ngram joue un rôle
pour laquelle une vie entière ne suffirait pionnier pour les sciences
pas. Mais le père Busa a une idée: se faire
aider par une machine. Il trouve le soutien
humaines.»
de Thomas Watson, le fondateur d’IBM, et
après trois décennies vient à bout de son
projet: 56 volumes et 70 000 pages. L’In-
dex Thomisticus est la première œuvre à
permettre une recherche simple et rapide Martin Volk a alors développé un sys-
dans les contenus d’un corpus entier. tème de correction en ligne qui a permis
à des volontaires d’éliminer les erreurs,
La montagne et le sport sous forme de jeu. Ce projet de science
La numérisation s’immisce aujourd’hui citoyenne a séduit les membres du CAS.
dans toutes les sciences humaines. «La «Grâce à leur aide, nous avons pu effectuer
linguistique et la littérature sont les prin- plus de 250 000 corrections en six mois.» Le
cipales intéressées, explique Martin Volk, corpus numérique est aujourd’hui presque
professeur de linguistique computation- correct à 100%. Une fois numérisés, les
nelle à l’Université de Zurich. Un accès nu- textes peuvent être facilement archivés et
mérique à leurs données de recherche leur consultés, une chose «impossible pour des
permet d’étayer ou d’invalider certaines documents anciens, rares ou difficilement
hypothèses à l’aide de chiffres et de statis- accessibles», souligne le chercheur.
tiques.» Dans le cadre de son propre projet
de recherche Text+Berg, le spécialiste a nu- Freud, Einstein, Darwin
mérisé les 250 volumes du Club Alpin Suisse Google Books est sans doute l’archive de ce
(CAS) parus depuis 1864. «Ce matériel est genre la plus célèbre et la plus complète.
◂ Pages 15 et 16. Les deux nous une mine d’informations. Il montre com- Sa recherche en texte intégral permet de
parlent de ce que nous mangeons: ment la façon d’envisager les montagnes parcourir les stocks des bibliothèques uni-
un regard jeté dans notre frigo et une a évolué avec le temps. Décrites autrefois versitaires de H arvard, Stanford et New
visualisation analytique des arômes. comme des objets d’exploration, elles sont York. Certaines bibliothèques européennes
La couleur indique les catégories, vues aujourd’hui comme un terrain d’en- sont également intégrées, comme celle
la taille des nœuds représente leur traînement sportif. Le terme ‹compétition› de l’Université d’Oxford ou la Bayerische
fréquence dans les recettes, et les est, par exemple, beaucoup plus fréquent Staatsbibliothek.
liens le nombre de composants que par le passé.» Ce gigantesque corpus a donné nais-
aromatiques qu’ils partagent. A l’Université de Genève, des cher- sance en 2010 à Google Ngram, une appli-
Images : Valérie Chételat (p. 15); cheurs veulent numériser une partie de cation web qui analyse la fréquence d’un
Yong-Yeol Ahn (p. 16) la Bibliotheca Bodmeriana, une collection mot ou d’une suite de mots dans tous les
Fonds national suisse – Académies suisses: Horizons no 105 17Point fort Humanités numériques
ouvrages dès 1800 scannés par Google. Elle l’impression que l’on a souvent lorsqu’on
permet d’étudier des événements histo- regarde des SMS isolés, explique Elisabeth
riques, comme l’abolition de l’esclavage, Stark. D’où la nécessité de disposer d’une
mais aussi d’observer l’évolution linguis- grande quantité de données.»
tique de certains mots au sein d’une langue,
ou encore la popularité des personnalités: Accéder aux données
les célébrités scientifiques que sont Freud, Les sciences humaines numériques per-
Einstein ou Darwin apparaissent toutes
mettent d’analyser la littérature et la
très fréquemment dans la littérature, langue à l’aide de chiffres, qui ont toujours
mais Freud est cité deux fois plus souvent été la marque des sciences exactes. Ils dé-
depuis 1950. crivent les schémas quantitatifs et les rela-
«Ngram n’est qu’un exemple de ce qu’on tions avec une précision dont les mots sont
peut faire aujourd’hui avec les données rarement capables. La prochaine généra-
culturelles numérisées», remarque son tion de chercheurs en sciences humaines
créateur Jean-Baptiste Michel, chercheur travaillera sur des données, comme le font
à l’Université Harvard. Les sciences hu- les bioinformaticiens depuis la fin du XXe
maines numériques sont aujourd’hui in- siècle. «Ce domaine profitera de l’augmen-
concevables sans Ngram, dont Martin Volk tation massive de la quantité de textes
confirme le «rôle pionnier». numérisés, opine Martin Volk. Comme le
séquençage du génome, qui a conduit à la
La culture du SMS bioinformatique, la numérisation de notre
La numérisation de la littérature n’est langue et de notre littérature fera inévi-
qu’une approche d’analyse linguistique. tablement bientôt partie intégrante des
«Avec nos ordinateurs et téléphones, nous sciences humaines.»
saisissons plus de textes numériques que Des chercheurs comme Martin Volk
jamais», souligne Elisabeth Stark, du Sémi- et Elisabeth Stark ne représentent que le
naire de langues romanes de l’Université début d’une nouvelle ère dans la recherche.
de Zurich. Rien qu’en 2013, plus de 100 mil- «Malheureusement, les ressources allouées
lions de SMS ont été envoyés chaque jour aux sciences humaines numériques sont
en Allemagne. «Ces textes ne sont presque limitées pour l’instant, en Suisse», déplore
jamais imprimés, mais font partie de notre Martin Volk. «Dans toute l’Université de
culture linguistique», poursuit la cher- Zurich, par exemple, il n’y a pas encore de
cheuse. Avec son projet du Fonds national chaire d’humanités numériques alors qu’il
suisse Sms4science, elle étudie les caracté- serait grand temps», renchérit Elisabeth
ristiques linguistiques de la communica- Stark. Mais les deux chercheurs semblent
tion par SMS en Suisse. trouver encore plus important de pou-
voir accéder aux principaux réservoirs
de données. «Des initiatives européennes
d’envergure existent, mais la Suisse n’en
fait malheureusement pas partie pour
La langue raccourcie des l’instant», regrette Elisabeth Stark. Jean-
Baptiste Michel abonde dans son sens:
SMS obéit aux même lois que «Pouvoir accéder aux données constitue le
celles du langage parlé. moteur essentiel!»
Mirko Bischofberger est collaborateur scientifique
du FNS.
Pour accéder à ces données, Elisabeth J.-B. Michel et al., Quantitative Analysis of Culture
Stark et ses collègues ont invité les utili- Using Millions of Digitized Books. Science, 2011
sateurs de portables en Suisse à envoyer
une copie de leurs SMS à un numéro gra-
tuit. «Nous avons ainsi pu collecter environ
26 000 messages.» Son équipe s’intéresse
notamment aux ellipses linguistiques, au-
trement dit aux omissions de mots, comme
dans les expressions «Arrive bientôt» ou
«T’appelle». Afin de découvrir pourquoi le
sujet est omis dans ces exemples, les cher-
cheurs ont analysé tous les SMS en français
et en allemand. Résultat: ces omissions
sont beaucoup plus rares qu’on ne l’ima-
ginait et obéissent aux mêmes lois que le
langage parlé quotidien. «Cela contredit
18 Fonds national suisse – Académies suisses: Horizons no 105Fonds national suisse – Académies suisses: Horizons no 105 19
20 Fonds national suisse – Académies suisses: Horizons no 105
Point fort Humanités numériques
Les archéologues
du numérique
Numériser les objets historiques Un processus difficile et coûteux, qu’il
ne les préserve pas du déclin. Un faut répéter régulièrement – le pendant
digital du t ravail des moines copistes du
projet suisse veut sauver les données Moyen Âge. «La plupart des groupes de
produites par la recherche. recherche n’ont pas les moyens de créer
des outils stables, poursuit Lukas Rosen-
Par Daniel Saraga thaler. L’idéal est de travailler avec eux
dès le début pour élaborer une base de
données durable qui puisse ensuite être
facilement mise à jour et migrée.»
Le mouvement de l’Open Research Data
encourage les chercheurs à générer des ré-
sultats scientifiques accessibles à chacun
I
et de manière interactive. Mais comme
nternet n’oublie jamais», assènent les roduction scientifique. Paradoxalement,
p toute machine, l’outil exige un entretien
experts inquiets de voir notre vie privée ce type de recherche numérique peut s’avé- régulier. Un travail de l’ombre essentiel
étalée sur le web. Mais rien n’est moins rer bien plus fragile qu’un résultat publié pour éviter de voir cette connaissance dis-
sûr: le changement constant des sup- sous forme d’article.» paraître à jamais.
ports de l’information n umérique et des
formats des fichiers laisse derrière lui des Les copistes du IIIe millénaire Daniel Saraga est responsable de la communica-
montagnes d’informations qui, inexorable- Le directeur des Digital Humanities Lab à tion scientifique du FNS.
ment, deviennent illisibles. Livrées à elles- l’Université de Bâle a pu sauver l’une des
mêmes, elles sont condamnées à l’oubli. plus importantes bases de données consa- Final report for the pilot project «Data and Service
Cette problématique touche de plein crée à la mythologie grecque, le Lexicon Center for the Humanities» SAGW, 2015
fouet les résultats scientifiques, exprimés Iconographicum Mythologiae Classicae, Le patrimoine culturel à l’ère numérique, Nike
de plus en plus souvent sous forme de bases qui s’est arrêté en 2009, après trente ans de Bulletin, juin 2014
de données. Car celles-ci vieillissent très développement: «Elle était complètement http://openresearchdata.ch/
rapidement: les langages de programma- hors service, et l’entreprise qui l’avait pro-
tion se révèlent obsolètes et les systèmes grammée était en faillite, poursuit Lukas
d’exploitation ne sont plus compatibles Rosenthaler. Nous avons même dû pirater
avec le nouveau serveur. le site, car les mots de passe avaient dispa-
«C’est un vrai problème, souligne L ukas ru. Notre travail ressemble parfois à une
Rosenthaler, responsable du Centre de sorte d’archéologie du numérique.» Ces Sauvegarder le sauveur
données et services pour les sciences hu- efforts redonnent une seconde vie aux ré-
maines (DDZ), un projet consacré à assurer sultats de la recherche. L’Université Har- Voué à la préservation des archives numé-
la pérennité des résultats scientifiques en vard, par exemple, s’intéresse aujourd’hui à riques, le Centre de données et services pour
sciences humaines (voir «Sauvegarder le intégrer le Lexicon dans son commentaire les sciences humaines (DDZ) est lui-même
sauveur»). Il est très rare que les chercheurs d’Homère, en utilisant les «linked open en danger. «Nous nous battons depuis
continuent à maintenir les infrastruc- data», une composante du web 3.0 qui per- 2008 pour mettre en place une plateforme
tures numériques une fois un projet – et met de relier les informations en ligne de stable, déclare Markus Zürcher, secrétaire
son financement – terminé. Une base de manière directe et dynamique. général de l’Académie suisse des sciences
données inaccessible est inutilisable, et Avec sa petite équipe, l’ancien physicien humaines, qui a lancé le projet. Toutes les
ne pas l’entretenir revient à détruire une s’est appuyé sur la technologie sémantique personnes concernées soutiennent cette
pour créer une plateforme générique ca- plateforme. La seule chose à régler, c’est le
pable de structurer des données provenant financement.»
◂ Pages 19 et 20. La cartographie de plateformes très variées. «J’estime que Le DDZ reste un projet pilote qui touche à
créé une forme de réalité augmentée nous pouvons traduire 99% des bases de son terme. «Nous avons déposé en mars
en ajoutant des données à la géogra- données utilisées en sciences humaines, 2015 une demande portant sur 2 millions
phie. Ces vues globales permettent et même certains projets en biologie. En de francs pour 2017–2020 auprès du SEFRI
d’identifier rapidement des informa- trois ans, nous avons migré une trentaine (Secrétariat d’Etat à la formation, à la
tions cachées, comme ici l’explosion de projets, de la mythologie grecque à une recherche et à l’innovation). D’ici là, nous
d’achats alimentaires avant Pâques collection de photographies historiques de sommes prêts à assurer le financement
et celle de la restauration sur la Cos- montagne.» jusqu’en 2017, car une interruption du
ta Tropical au sud de l’Espagne. Le DDZ suit le concept de l’Open projet serait très néfaste.» Par comparaison,
Images: Valérie Chételat (p. 19); Archival Information System: copier les quelque 30 millions sont dépensés annuel-
MIT Senseable City Lab – Carlo Ratti, Director – données régulièrement et les retrans- lement pour les bases de données dans les
Pedro Cruz: Visualization (p. 20) crire dans un nouveau format plus actuel. sciences humaines.
Fonds national suisse – Académies suisses: Horizons no 105 21Point fort Humanités numériques
«Il ne s’agit pas
d’une révolution»
Les humanités numériques ne constituent de certains mots fonctionnels. La répar-
que des nouvelles méthodes, mais elles tition statistique des fréquences de mots
dans ses récits permet d’objectiver la par-
permettent de poser un nouveau type de ticularité de son style. Elle nous dit aussi
questions. Gerhard Lauer est un pionnier quelque chose sur l’époque. Nous n’étudions
plus seulement le canon littéraire, comme
des techniques informatiques pour l’analyse «Les Affinités électives» de Goethe, mais les
littéraire qui se décrit comme un conservateur. nombreux livres qui étaient populaires à la
Propos recueillis par Urs Hafner même période. L’histoire culturelle de ce
qui était lu passe ainsi au premier plan, et
plus seulement les belles lettres. Il s’agit de
premiers éléments, pas encore de connais-
sances qui chamboulent tout. La nouveau-
té, ce sont les méthodes.
Gerhard Lauer, que comprenez-vous par
le terme d’humanités numériques? L’analyse historico-herméneutique
Quelque chose de très pratique: l’utilisa- n’est-elle pas supérieure au comptage
tion de méthodes informatiques pour réali- de mots?
ser des éditions numériques et analyser de Tel est peut-être encore le cas, mais cela
gros volumes de textes de manière plutôt change au fur et à mesure des résultats
quantitative. que nous obtenons. Nous identifions
toujours plus clairement certains sché-
Les humanités numériques ont-elles mas textuels à partir desquels nous pou-
modifié votre recherche? vons déduire l’évolution de l’aptitude hu-
Oui, mais pas abruptement. Elles com- maine à raconter. On peut ainsi aborder de
mencent seulement à transformer la re- nouvelles questions, notamment la diffé-
Notre héritage culturel ne devrait cherche en sciences humaines, dans la me- rence entre narration européenne et nar-
pas être défini par Google, soutient sure où elles étendent peu à peu le spectre ration asiatique.
Gerhard Lauer. des méthodes et des questions. Nous en-
treprenons l’analyse de la littérature de Comment procédez-vous lorsque vous
manière quantitative, par exemple celle du cherchez à savoir ce que les gens lisaient
«Werther» de Goethe ou les récits de Kafka. en Europe au début du XIXe siècle?
Du côté des étudiants, la demande pour Nous évaluons des sources et des méta
ces méthodes augmente, et j’accompagne données recueillies à partir de différents
à présent les premiers travaux de bachelor catalogues de bibliothèques. De là, nous
dans ce domaine. pouvons déduire quels livres étaient impri-
més, achetés, empruntés et probablement
Traditionnellement, le texte se trouve lus par les gens. Ou alors, nous utilisons
au cœur des sciences humaines. Celles- l’outil Ngram Viewer de Google qui permet
ci analysent son sens manifeste et de parcourir près de cinq millions de livres
latent, et ouvrent leurs conclusions à en différentes langues.
la discussion sur un mode narratif et
argumentatif. Les humanités numériques L’analyse Ngram est pourtant sélective:
passent à côté de cette dimension. les critères en fonction desquels Google
A première vue, vous avez raison: ce qu’elles numérise ou non certains livres restent
font avant tout, c’est compter des mots. inconnus.
Mais la répartition de ces derniers dans les C’est vrai. Les corpus avec lesquels nous tra-
textes dit bel et bien quelque chose sur ces vaillons n’ont souvent pas été constitués de
mêmes textes. Le type de mots utilisé par manière systématique et ne sont pas équili-
un auteur nous en apprend beaucoup sur brés statistiquement. Google Books est par-
lui. On peut penser que l’emploi d’articles ticulièrement problématique, car Google
et de pronoms ne dit pas grand-chose, mais a numérisé au hasard des bibliothèques
c’est le contraire. entières. Ce n’est pas un corpus. Cette en-
treprise définit ainsi ce qui constitue notre
Quelles connaissances avez-vous pu héritage culturel. Il incombe donc aux
ainsi générer? universités et aux bibliothèques de s’enga-
Nous nous intéressons par exemple au ger pour que l’héritage culturel ne soit pas
nombre de mots courts et de mots longs privatisé, mais qu’il puisse être évalué de
qu’utilisait Kafka, comparé à d’autres au- façon critique. En sciences humaines, nous
teurs de son époque, ou encore à son usage faisons trop peu face à ce défi culturel.
22 Fonds national suisse – Académies suisses: Horizons no 105Les adeptes des humanités numériques «Les sciences humaines se
parlent souvent de révolution. Vous modernisent, mais à très
aussi?
C’est la numérisation qui est une révo- petits pas.»
lution, pas les humanités numériques.
Les sciences humaines se transforment,
comme la chimie, la physique, la médecine
et la biologie se sont transformées lors-
qu’elles ont intégré certaines méthodes
informatiques. La biologie a profondément de pratiquer l’analyse littéraire. Bien en-
changé avec le recours à l’ordinateur, mais tendu, dans un champ nouveau, presque
sans rien perdre en tant que discipline. Il se tout le monde se connaît, et un esprit
produira la même chose avec les sciences d’équipe émerge. J’ai des contacts aussi
humaines. L’archéologie et les sciences du dans les centres suisses, à Lausanne, à Bâle
langage ont déjà franchi le pas. Les huma- et à Berne. Leur méthodologie fait aussi
nités numériques représentent pour ainsi que les humanités numériques sont plus
dire un sentiment de révolution: quelque collaboratives que les sciences humaines
chose de nouveau arrive, notamment des ne le sont d’habitude.
chiffres et des statistiques, et de nom-
breuses disciplines ne savent pas encore Les humanités numériques se
comment l’appréhender. soucient-elles suffisamment de savoir,
par exemple, dans quelle mesure
l’utilisation du numérique modifie le
statut du texte?
Là, il y a des déficits, car les questions fon-
«Nous ne disposons pas damentales et le travail pratique n’ont
encore de méthodologie souvent pas encore été réunis, alors qu’on
débat beaucoup de critique d’algorithmes
confirmée.» et du texte numérisé. Mais il ne faut pas
oublier que nous n’en sommes qu’au début,
que nous évoluons souvent en marge, et
que nous ne disposons pas encore de mé-
Les sciences humaines prennent-elles thodologie confirmée.
pour modèle les sciences naturelles,
qui sont habituées aux méthodes Les sciences humaines dans l’ensemble
quantitatives, dans l’espoir d’obtenir évoluent en marge.
davantage de fonds de recherche? Si elles continuent comme elles l’ont fait
Il faut distinguer entre deux intérêts jusqu’ici, leur avenir ne sera pas brillant.
contra dictoires. D’un côté, la politique Leur situation est difficile. Dans les pays
d’encouragement de la recherche s’oriente anglo-saxons, elles ne reçoivent pratique-
en fonction des tendances vers ce qui pro- ment plus de fonds publics et doivent se
met la prochaine nouveauté. Actuellement, financer presque intégralement par les
les humanités numériques sont considé- écolages.
rées comme un domaine prometteur, on y
investit donc de l’argent. D’un autre côté, il Voyez-vous les humanités numériques
s’agit d’un secteur où il est difficile de trou- comme une bouée de sauvetage?
ver un emploi dans les facultés établies. Non. Dans le meilleur des cas, comme une
Celles-ci font souvent preuve de beaucoup partie de la solution. Indépendamment
de retenue et ont plutôt tendance à engager des méthodes numériques, les sciences
un chercheur qui correspond à la concep- humaines doivent répondre à une grande
tion traditionnelle des sciences humaines. question: celle de savoir ce qu’elles veulent
Ces dernières se modernisent, mais à très enseigner à l’avenir. Et ce sans perdre de Un penseur non conventionnel
petit pas. Les choses sont différentes pour vue les changements fondamentaux que la
les bibliothèques et l’édition. modernisation numérique exige de nous. Les humanités numériques constituent un
point fort des travaux de Gerhard Lauer, qui
Avez-vous le sentiment d’appartenir à L’historien Urs Hafner est journaliste scientifique enseigne la philologie allemande à l’Univer-
une avant-garde? et ancien rédacteur en chef d’Horizons. sité de Göttingen (D). Il a récemment publié
Non. On m’a attribué ce rôle – ainsi qu’à des travaux consacrés à Thomas Mann et
d’autres – sans que je l’aie cherché, car je Joane K. Rowling, et a étudié les réactions de
suis plutôt conservateur dans ma manière la pupille chez le lecteur.
Fonds national suisse – Académies suisses: Horizons no 105 23Vous pouvez aussi lire