Intelligence artificielle et santé animale - productions ...

La page est créée Gilles Benard
 
CONTINUER À LIRE
Intelligence artificielle et santé animale - productions ...
Intelligence artificielle                                                                                                    INRAE Prod. Anim.,
                                                                                                                              2020, 33 (2), 95-108

  et santé animale
Pauline EZANNO1, Sébastien PICAULT1, Nathalie WINTER2, Gaël BEAUNÉE1, Hervé MONOD3, Jean-François GUÉGAN4,5,6
1
  INRAE, Oniris, BIOEPAR, 44300, Nantes, France
2
  INRAE, ISP, Tours, France
3
  INRAE, MaIAGE, Jouy-en-Josas, France
4
  INRAE, CIRAD, UM, ASTRE, Montpellier, France
5
  IRD, CNRS, UM, MIVEGEC, Montpellier, France
6
  Programme international FutureEarth du programme des Nations unies pour l’environnement, Global research
programme oneHEALTH, Paris hub, France
Courriel : pauline.ezanno@inrae.fr

„„ Les recherches à l’interface entre Santé Animale (SA) et Intelligence Artificielle (IA) sont en plein essor.
Elles permettent de s’engager sur de nouveaux fronts de science en SA, de lever des verrous méthodologiques
et d’identifier les défis de demain en agriculture. Portés par le regain d’intérêt récent pour l’IA, de nouveaux
outils d’aide à la détection en médecine animale et d’aide à la gestion sanitaire émergent, ouvrant des horizons
nouveaux pour la sécurité sanitaire.

Introduction
                                                           infrastructures de calcul, l’apprentis-       manière plus réaliste, l’aide à la décision
                                                           sage devient profond (« deep learning »),     humaine (systèmes experts, aide au dia-
  L’IA correspond à un large ensemble                      i.e. explore ces données massives que         gnostics, allocation de ressources…).
de théories et technologies mobilisées                     ne peuvent traiter les méthodes sta-          Pour cela, un large panel de concepts
pour résoudre des problèmes de forte                       tistiques. Par ailleurs, des algorithmes      et méthodes sont développés en IA
complexité logique ou algorithmique                        apprenant sont développés, abou-              (FranceIA, 2017), parmi lesquels les
(Villani, 2018). Nous retiendrons ici                      tissant par exemple aujourd’hui aux           méthodes d’apprentissage, mais aussi
une acception large de l’IA, en tenant                     réseaux de neurones artificiels et aux        les méthodes de résolution de pro-
compte des interactions et complémen-                      machines vecteur support (SVM). Les           blèmes complexes, d’automatisation
tarités avec les disciplines connexes que                  développements récents se sont nour-          de tâches ou de raisonnements, d’in-
sont l’informatique, l’algorithmique,                      ris des interfaces créées entre l’IA et les   tégration d’informations provenant de
les mathématiques et les statistiques.                     autres disciplines, comme par exemple         sources hétérogènes, ou encore d’aide
Concept introduit dans les années 1950,                    la biomédecine, ainsi que des données         à la décision (figure 1).
notamment par A. Turing, nombre de                         massives issues de différents champs
méthodes ont été développées ou                            disciplinaires, notamment associés à la          Une partie des recherches menées
étendues relativement récemment                            santé (Hosny et al., 2018 ; Karczewski et     aux fronts de science en SA prend une
avec l’amélioration des performances                       Snyder, 2018).                                ampleur nouvelle en mobilisant de telles
des ordinateurs. Ainsi, l’apprentissage                                                                  méthodes d’IA, mais aussi par le déve-
automatique (« machine learning ») se                        L’IA s’attache à adresser trois défis       loppement de données massives. Ainsi,
développe dès les années 1980. Une des                     qui font également sens en SA : i) la         les recherches en SA bénéficient des
méthodes de l’IA les plus connues du                       compréhension d’une situation et de           avancées sur les méthodes d’appren-
grand public, elle correspond à analyser                   sa dynamique, telle qu’une dynamique          tissage, par exemple en épidémiologie
des données pour en déduire des règles                     épidémique ; ii) la perception de l’en-       prédictive, en médecine de précision
à suivre, voire permet de s’autocorriger                   vironnement qui se traduit en SA par          individualisée, et dans l’étude des rela-
avec l’arrivée de nouvelles données. À                     la détection de patrons, de formes ou         tions hôtes × pathogènes (Zhang et al.,
partir des années 2000, avec l’essor des                   de signaux à différentes échelles ; iii) la   2017 ; Karczewski et Snyder 2018). Ces
données massives (« big data ») et des                     prise de décision par l’ordinateur, ou, de    méthodes facilitent le diagnostic et la

https://doi.org/10.20870/productions-animales.2020.33.2.3572                                             INRAE Productions Animales, 2020, numéro 2
Intelligence artificielle et santé animale - productions ...
96 / Pauline ezanno et al.

Figure 1. Structure de l’article et positionnement de quelques thèmes de recherche en santé animale (en noir) et de concepts
et méthodes d’intelligence artificielle utiles pour les développer (en vert).

                                                                                           Apprentissage
                                                                                            automatique
                                                                                     Diagnostic            Classification
                                                                                                           automatique
                                                                                     Télémédecine
Collecte                                                     DÉTECTION                                        Systèmes experts
                                                                                     Médecine de précision
          Organisation                                 §3                                                      Reconnaissance
                                                                                     Surveillance
                                                                                                                  de formes
                   Accès partagé
                                                                                                                     Intégration
                                                                                     Biologie fondamentale          automatique
                                                        COMPRÉHENSION                Épidémiologie                 d’informations
                                                       §2                                                           hétérogènes
                                                                                     Phylodynamique
            DONNÉES
                                                                                                             Systèmes Multi-Agents
     §1                                                                                                        Représentation
                                                                                     Décisions, conseils     des connaissances
                                                             PRÉVISIONS /
                                                                                     Gestion adaptative        Génération
                                                            SCÉNARISATION
                                                       §4                            Innovations           automatique de code
                                                                                              Résolution de
                                                                                          problèmes complexes

détection de cas, fiabilisent les prédic-     l’IA, pour partie sur des thématiques       particuliers (pathogènes partagés
tions et réduisent les erreurs, accélèrent    communes avec la santé humaine,             comme pour la peste porcine afri-
les décisions, améliorent la précision        pour partie du fait des spécificités des    caine, passage de la barrière d’espèce
des analyses de risque et permettent          recherches en SA (Ducrot et al., 2011),     facilitée par des contacts fréquents).
de mieux cibler les interventions (Saria      et qui peuvent constituer des verrous       L’intensité de ces interactions pourrait
et al., 2018). Les recherches en SA béné-     particuliers. Premièrement, le contexte     croître du fait des actions seules ou
ficient aussi d’avancées scientifiques en     agro- et socio-économique est crucial       combinées des pressions environne-
IA sur la représentation des connais-         pour ces systèmes biologiques gérés         mentales (artificialisation des terres
sances et la modélisation des raisonne-       par l’humain et sources de revenus          et occupation par le bétail), démogra-
ments (Bedi et al., 2015), des processus      (animaux de rente), et qui sont forte-      phiques (demande mondiale crois-
décisionnels et de gestion de l’incerti-      ment soumis aux attentes sociétales         sante en productions animales) et
tude (Lynn, 2019), sur les parcours de        en termes d’éthique et de bien-être         sociétales (conduite en plein air du
vie des patients (Pinaire et al., 2017), en   animal (Connehaye et Duée, 2015).           bétail). Vu sous un autre angle, travail-
résolution de problèmes avec allocation       Les mesures conventionnelles de maî-        ler sur des réseaux de maladies mul-
de ressources sous contrainte (Vrakas         trise des maladies animales peuvent         ti-espèces fournit des informations
et Vlahavas, 2008), sur les agents auto-      ne plus être acceptables (par exemple       cruciales sur les mécanismes molécu-
nomes (Shakshuki et Reid, 2015) et les        l’abattage sanitaire, l’utilisation d’an-   laires sous-jacents (Anvar et al., 2011).
systèmes multi-agents (Roche et al.,          tibiotiques ; Hur et al., 2019). Des        Troisièmement, les populations ani-
2008) voire multi-niveaux (Picault et         alternatives doivent être identifiées et    males sont soumises à des prises de
al., 2017), ainsi que sur la génération       évaluées, et l’IA peut y contribuer. Par    décision récurrentes qui concernent
automatique de code informatique              exemple, le recours à une médecine          aussi la gestion de la santé (commerce,
(Russell et Norvig, 2010). Ces avancées       vétérinaire individualisée est une alter-   mesures de maîtrise…) notamment
méthodologiques permettent ainsi des          native qui mobilise des méthodes d’IA       pour les maladies non réglementées
représentations plus réalistes et lisibles    ainsi que des données différentes de        (décisions adaptatives des éleveurs).
par des non informaticiens de systèmes        celles de la santé humaine (Behmann         Les critères économiques et l’impact
biologiques complexes tels que ren-           et al., 2016). L’intégration des données    sur le revenu des éleveurs sont alors
contrés en SA, ainsi que la production        issues du séquençage massif en SA,          des indicateurs incontournables pour
de modèles pour anticiper l’effet de          incluant les technologies émergentes        évaluer les stratégies de maîtrise, par-
décisions de maîtrise ou de conduite à        d’étude du métabolome et de l’épigé-        fois en contradiction avec les attentes
différentes échelles (animal, troupeau,       nome, est aussi un challenge à relever      sociétales. Toutes ces spécificités font
région…).                                     rapidement (Suravajhala et al., 2016 ;      de l’interface entre IA et SA un thème
                                              Goldansaz et al., 2017). Deuxièmement,      d’intérêt pour stimuler de nouveaux
   Mener des travaux de recherche à           les interactions entre espèces, notam-      travaux méthodologiques et lever
l’interface entre IA et SA conduit aussi à    ment entre faune domestique et sau-         certains des verrous auxquels sont
identifier de nouveaux challenges pour        vage, entraînent des risques infectieux     confrontés les recherches en SA.

INRAE Productions Animales, 2020, numéro 2
Intelligence artificielle et santé animale - productions ...
Intelligence artificielle et santé animale / 97

   Sur la base d’une revue de la littéra-
                                                  Encadré 1. Analyse bibliométrique systématique.
ture des articles scientifiques à l’inter-
face entre IA et SA publiés entre 2009            Les publications ont été recherchées dans PubMed et ISI Web of Knowledge pour la période allant de 2009
et 2019 (encadré 1), complétée d’en-              à 2019. Les mots-clés ont été recherchés dans les titres, mots-clés auteurs et résumés des publications.
tretiens conduits avec des chercheurs             Seuls les articles en anglais ont été conservés. Dans ISI Web of Knowledge, toutes les bases de données ont
et enseignants-chercheurs français                été mobilisées, mais les catégories de recherche visiblement en dehors de la thématique ont été retirées
positionnés à cette interface (enca-              pour limiter le nombre de résumés à parcourir. Les doublons ont été retirés (mêmes auteurs, titre, année,
dré 2), nous avons déterminé les grands           support) lors de la lecture des titres et résumés.
domaines de recherche en SA dans les-
quels l’IA était aujourd’hui mobilisée            Mots-clés recherchés : (health OR disease OR pathogen OR epidem*) AND (“artificial intelligence” OR
(figure 1). Nous avons exploré com-               “machine learning” OR “multi-agent” OR “multilevel agent” OR “markov decision process” OR “hidden mar-
ment les méthodes d’IA contribuent à              kov”) AND (animal OR livestock OR cattle OR pig OR poultry OR wildlife) NOT cancer.
revisiter les questions de recherche en
SA et permettent de lever des verrous             Les publications visiblement hors thème à la lecture des titres et résumés ont été retirées, puis à nouveau
méthodologiques. Nous avons égale-                à la lecture des articles. D’autres publications qui ne ressortaient pas sur ces bases de données mais
ment analysé comment des questions                connues des auteurs pour être dans ce thème (connaissance des travaux des équipes concernées par ces
de recherche en SA interrogent et sti-            publications) ont été rajoutées. Au final, 110 publications ont été retenues (tableau 1). La liste de ces
mulent de nouveaux travaux en IA.                 références est disponible sur demande.
Nous nous attacherons ici à discuter de
la collecte, de l’organisation et de l’ac-
cessibilité aux données en SA (partie 1),    Tableau 1. Sélection des articles publiés à l’interface entre intelligence artificielle
puis à discuter comment les méthodes         et santé animale.
d’IA nous permettent de revisiter notre
compréhension des pathosystèmes                         Base de données                      « PubMed »          « Web of Knowledge »                 Total
(partie 2), à améliorer la détection
de cas et le diagnostic à différentes            Nombre d’articles identifiés                      128                         395                       *
échelles (partie 3), et à prévoir et scé-
nariser le devenir des pathosystèmes             Sélection sur titres et résumés                   35                           58                     77
pour en améliorer la gestion, faciliter
les prises de décision, et stimuler les          Références complémentaires                                                                            33
innovations (partie 4). Enfin, nous dis-
cuterons des freins et leviers possibles         Publications retenues                                                                                 110
au développement de l’IA en SA (par-
                                             Il existait des doublons entre les deux bases de données, le total n’est donc pas calculable avant lecture
                                             *
tie 5), avant de conclure sur des recom-     des titres et résumés des publications.
mandations pour se saisir au mieux des
enjeux que représente cette interface
SA/IA (partie 6).
                                             rature corporelle, production et com-                       troupeaux lors de programmes de suivi
                                             position du lait, reproduction, poids,                      de cohortes par exemple ; iii) réglemen-
1. Collecter, organiser                      alimentation…) ou ses caractéris-                           tairement (mouvements commerciaux
et rendre accessibles                        tiques propres (données génomiques,                         des bovins, plateforme d’épidémio-sur-
des données de qualité                       métaboliques…). Certaines données                           veillance) ; iv) par des entreprises pri-
                                             existent déjà (mais ne sont pas toujours                    vées (mouvements des porcs, collecte
                                             accessibles aux académiques), d’autres                      du lait), et v) de manière ad hoc dans
  Un point central pour les recherches       (métabolome par exemple) repré-                             le cadre de projets de recherche. Cette
en SA reste le lien aux données d’obser-     sentent un enjeu dont il convient de se                     caractéristique entraîne une très grande
vation, lesquelles sont structurées entre    saisir. Le processus de mondialisation et                   diversité de propriétés des données, et
échelles d’organisation du vivant, ainsi     d’échanges d’animaux à large échelle                        donc de leur gestion, accès et usages
qu’entre échelles spatio-temporelles         conduit aussi à inclure le niveau global                    possibles.
(Ezenwa et al., 2015). Les données           dans les recherches en épidémiologie
d’intérêt sont diverses : elles peuvent      quantitative et plus généralement en                          Il convient de réfléchir aux futurs
concerner des zones plus ou moins            SA (transferts d’agents infectieux, géné-                   systèmes d’observation, de collecte et
grandes, des troupeaux, ou des groupes       tique et gestion des races…).                               de gestion de ces données, et aux pra-
d’animaux (données épidémiologiques,                                                                     tiques visant à une meilleure collabo-
de détention d’animaux et de mouve-             L’ensemble de ces données massives                       ration entre les parties-prenantes. Si la
ments commerciaux, météorologiques,          et hétérogènes peuvent être collectées :                    gestion des données a toujours été un
parcellaires…). Elles peuvent aussi          i) automatiquement (capteurs, sys-                          élément important en recherche finali-
concerner l’animal lui-même, en lien         tèmes de vidéo-surveillance…) ; ii) spé-                    sée pour faciliter leur utilisation et leur
avec le système de production (tempé-        cifiquement pour certains animaux ou                        valorisation, il s’agit aujourd’hui d’une

                                                                                                         INRAE Productions Animales, 2020, numéro 2
98 / Pauline ezanno et al.

  Encadré 2. Conduite des entretiens.

  Toutes les unités du Département Santé Animale (DSA) d’INRAE ont été contactées. Des personnes ont été ciblées sur avis des directeurs d’unité et des membres
  du groupe de travail. Des entretiens complémentaires ont été menés dans d’autres départements d’INRAE et hors d’INRAE, pour avoir une vision plus précise des
  forces et compétences en présence en France à l’interface IA/SA, de l’intérêt des scientifiques pour cette interface, et des illustrations de collectifs organisés à une
  interface comparable (dans le domaine de la santé s.l.).
  À INRAE, au sein du DSA, ont été contactés : C. Citti, I. Oswald, P. Martin, D. Concordet et A. Bousquet-Mélou (Toulouse), S. Picault, G. Beaunée, A. Madouasse et
  P. Ezanno (Nantes), N. Winter (Tours), projet CaSciModOT (région Val-de-Loire), J.-F. Guégan (Montpellier). Au sein du département Mathématiques et Informatique
  Appliquées (MIA), ont été contactés : H. Monod (Chef du Département, Jouy-en-Josas), F. Garcia et T. Schiex (Toulouse), E. Vergu (Jouy-en-Josas). Par ailleurs, ont
  été contactés : C. Lannou (Chef du Département Santé des Plantes et Environnement (SPE), Jouy-en-Josas), C. Bastien (Chef du Département Ecologie des Forêt,
  Prairies et milieux Aquatiques (EFPA), Grand-Est-Nancy), et A. Franc (EFPA, Bordeaux), ainsi que R. Thiébaut (Inserm/Inria, Bordeaux), Charline Smadi (Irstea,
  Grenoble), et Maguelonne Teisseire (Irstea, Montpellier). Les entretiens abordaient les points suivants :
  – Quelles recherches menées dans l’équipe en lien avec l’IA ? Quelle plus-value pour les recherches en SA ? Quel positionnement par rapport à la liste des thèmes
  retenus ?
  – Ces recherches sont-elles menées en collaboration ? Quelles compétences clés sont mobilisées ?
  – Quel est le principal verrou (données, compétences, méthodes, collaborations…) ?
  – Quel front de science à cette interface IA/SA ? Positionné en SA (on peut aborder de nouvelles questions ou revisiter des questions) ou en IA (développement
  de nouvelles méthodes, nouveaux concepts) ?
  – Quel exemple concret pour illustrer le propos ?
  – Qui d’autre devrions-nous contacter ?
  Les thèmes en IA retenus étaient les suivants :
  – Représentation des connaissances : langage domaine-spécifique, ontologie.
  – Méta-modélisation symbolique ou numérique, génération automatique de code informatique, adaptation de code en autonomie.

question stratégique tant en recherche                    données de SA (dualité entre la notion                      à plus grande échelle des solutions
théorique que plus appliquée couplée                      de bien public et le caractère priva-                       innovantes et accélérerait leur mise au
aussi à un challenge technique (Pfeiffer                  tif de certaines données) pour rendre                       point et leur évaluation. Une expertise
et Stevens, 2015). Il apparaît nécessaire                 possible l’expérimentation en situations                    conséquente existe (plateforme de
de rendre interopérables les sources                      réelles et comparer les performances                        données épidémiologiques, grandes
hétérogènes de données, requérant                         des algorithmes d’IA (Prospective,                          cohortes, fermes expérimentales, zones
des développements méthodologiques                        2019) ? Lever ces interrogations facili-                    ateliers…) qui pourrait être mise à pro-
dédiés. Par ailleurs, une grande partie                   terait aussi la collecte de données ad                      fit. De plus, l’IA pourrait contribuer à
des données relève de la sphère privée,                   hoc. L’IA, notamment par les systèmes                       revisiter les méthodes d’échantillon-
avec une propriété à caractère souvent                    experts et les systèmes multi-agents,                       nage pour la collecte de données de
hétérogène (propriétaires multiples,                      aide à construire une représentation                        terrain en santé et en épidémio-sur-
données non centralisées, données fer-                    réaliste de systèmes biologiques com-                       veillance animale, en ciblant mieux et
mées), et parfois floue (méconnaissance                   plexes et se révèle ainsi un outil effi-                    de manière dynamique les données à
du propriétaire réel de la donnée entre,                  cace pour favoriser la participation des                    collecter tout en évitant les données
par exemple, l’éleveur et le collecteur                   acteurs d’une filière donnée à la prise de                  colinéaires redondantes.
des données) ; ce qui tend à complexi-                    décision optimisée, voire l’évaluation de
fier grandement l’accès aux données,                      l’impact de modifications des usages et
interroge sur la propriété intellectuelle,                pratiques (Binot et al., 2015).
                                                                                                                      2. Apports de l’IA
et pose un certain nombre de questions                                                                                pour la compréhension
en lien avec un Règlement Général sur la                     Permettre l’expérimentation des                          des pathosystèmes
Protection des Données (RGPD) adapté                      technologies IA sur des territoires est
à la SA dans le respect de la confiden-                   un enjeu crucial pour favoriser leur
                                                                                                                      „„2.1. Mieux comprendre
tialité des données mobilisées. Quel                      développement, valider leur perfor-
                                                                                                                      l’évolution des pathosystèmes
est le modèle économique pertinent                        mance et mesurer leur qualité prédic-
                                                                                                                      à large échelle
au regard de la collecte de données                       tive (Prospective, 2019). En santé, l’accès
ou de l’accès à des bases de données                      simplifié à des structures génératrices                      Les méthodes d’apprentissage
existantes ? Quid de l­’ouverture des                     de données permettrait ­d’expérimenter                      peuvent être utilisées pour réaliser

INRAE Productions Animales, 2020, numéro 2
Intelligence artificielle et santé animale / 99

des reconstructions phylogénétiques             et al., 2019) ; continent : (Buhnerkempe     matique, les constituants du modèle
et ainsi proposer des scénarios évo-            et al., 2014). Ces modèles dits méca-        (hypothèses, ontologie des connais-
lutifs, notamment d’agents infectieux           nistes permettent d’anticiper les effets     sances, structure, paramètres, fonc-
et de leurs modes de transmission.              de mesures de maîtrise convention-           tions, règles…) sont accessibles dans un
Ainsi, les modèles phylogénétiques              nelles, mais aussi innovantes (nouvelles     fichier texte structuré, lisible et révisable
offrent une perspective intéressante            molécules candidates, capteurs, index        par les non-informaticiens, scientifiques
pour identifier les lignées bactériennes        de sélection génomique ; Ezanno et           ou gestionnaires, rendant les modèles
environnementales à fort potentiel              al., 2015). Cependant, ils requièrent        plus transparents. À ce jour, un langage
infectieux (Bailly, 2017), ou encore pré-       d’intégrer des données et expertises         domaine spécifique dédié à l’épidémio-
dire les espèces réservoirs et vecteurs         multiples en biologie, épidémiologie,        logie concerne les modèles à équations
arthropodes en jeu (Babayan et al.,             évolution, écologie, agronomie, éco-         différentielles, dits à compartiments
2018). Ensuite, aller vers des modèles          nomie, etc. Leur développement pose          de type Susceptible-Infecté-Résistant
de niches plus phénoménologiques                alors des enjeux de fiabilité, de transpa-   (SIR) (Bui et al., 2015). Deuxièmement,
contribuerait à surveiller les infections       rence, de reproductibilité, et de flexibi-   l’utilisation d’agents logiciels auto-
émergentes et anticiper la diffusion épi-       lité d’usage. De plus, ces modèles sont      nomes permet de représenter des
zootique ou épidémique d’agents infec-          souvent développés de novo, mobili-          niveaux d’abstraction et d’organisation
tieux. Des modèles multi-agents dans            sant peu les modèles d’autres pathosys-      variés à plusieurs échelles (Mathieu
un contexte spatial explicite ont ainsi         tèmes. Enfin, ces modèles peuvent être       et al., 2018), rendant les modèles plus
été développés pour des transmissions           considérés comme des boîtes noires par       flexibles. Très récemment, un logiciel
d’agents pathogènes vectorisés, et sont         leurs utilisateurs finaux (gestionnaires     générique (EMULSION, figure 2, Picault
suffisamment ergonomiques pour être             de la santé) alors qu’ils reposent sur       et al., 2019b) a été développé, mobili-
adaptés à des contextes particuliers            des hypothèses biologiques explicites        sant à la fois un langage dédié et une
(Roche et al., 2008). Enfin, des réseaux        mais souvent cachées dans le code ou         architecture logicielle à base d’agents.
de neurones ont permis d’identifier le          les équations.                               Cette approche double a l’ambition de
niveau d’introgression génétique entre                                                       répondre le mieux possible aux besoins
des populations sauvages et des popu-              Bien qu’incontournables, les bonnes       récurrents de transparence, fiabilité et
lations domestiquées dans un contexte           pratiques de programmation (Sandve           flexibilité en modélisation des maladies
spatialisé (Lek et Guégan, 2000), ce qui        et al., 2013) seules ne peuvent répondre     transmissibles. Un simulateur interprète
aide à comprendre la diffusion de gènes         à ces enjeux (Leek et Peng, 2015).           les fichiers textes décrivant le système
dans les systèmes hôtes × pathogènes            L’approche la plus aboutie à ce jour en      pour produire le code du modèle, ce
à multi-espèces hôtes. Notons ici que           épidémiologie requiert encore d’écrire       pour tout type de formalismes (modèles
plusieurs de ces travaux révèlent le            beaucoup de code (O’Hare et al., 2016).      à compartiments, individu-centrés) et
caractère relativement ancien de cette          Des méthodes adaptées manquent               d’échelles (individu, population, terri-
recherche en IA. Ces recherches ont sou-        pour faciliter le développement de ces       toire). Des briques de code complémen-
vent permis d’identifier des signaux (par       modèles, notamment pour représenter          taires peuvent être ajoutées pour des
exemple la tendance d’introgression             des systèmes multi-échelles. Ainsi, les      processus spécifiques au pathosystème
génétique) voire des patrons ou des             processus intra-hôtes sont rarement          étudié. La révision des hypothèses du
propriétés particulières (par exemple           considérés pour prédire la propagation       modèle ne nécessite plus de réécrire le
l’importance de la densité-dépendance           de pathogènes dans des populations,          code. Ce type d’approche devrait aussi
dans la transmission d’infections par           alors que l’hétérogénéité individuelle       faciliter la production d’outils d’aide à
des insectes vecteurs) moins visibles           des hôtes est un facteur crucial de cette    la décision destinés aux gestionnaires
ou absents dans les traitements statis-         propagation (par exemple les interac-        et aux décideurs publics de la SA et de
tiques plus conventionnels.                     tions microbiote × pathogène × immu-         la sécurité sanitaire plus généralement.
                                                nité, Vodovotz et al., 2016).
„„2.2. Garantir fiabilité,                                                                   „„2.3. Extraire
reproductibilité                                  Mobiliser l’IA pour répondre à             des connaissances
et flexibilité des modèles                      ces enjeux s’avère prometteur.               des données massives
épidémiologiques                                Premièrement, les méthodes de repré-         de biologie fondamentale
                                                sentation des connaissances per-             en santé animale
   Pour comprendre et prédire la pro-           mettent d’expliciter la structure des
pagation de pathogènes, il est utile de         modèles mécanistes et de réduire le             Les méthodes d’apprentissage faci-
représenter de manière explicite et inté-       code à écrire, accélérant et fiabilisant     litent aussi des travaux de biologie fon-
grative dans un modèle mathématique             leur développement. La séparation            damentale, en mobilisant par exemple
(équations) ou informatique (simula-            entre le développement logiciel et la        des analyses morphologiques pour
tions) les mécanismes sous-jacents à la         représentation des connaissances per-        étudier la mobilité cellulaire (Sebag et
dynamique du pathosystème, et ce à dif-         met à des scientifiques de discipline non    al., 2015). L’utilisation d’approches de
férentes échelles (intra-hôte : Go et al.,      informatique de contribuer à concevoir       classification et de filtres intelligents
2019 ; filières de production primaire :        puis à évaluer les modèles. Au lieu de       permet aujourd’hui de trier des don-
Ferrer Savall et al., 2016 ; territoire : (Qi   n’exister que sous forme de code infor-      nées massives de biologie moléculaire

                                                                                             INRAE Productions Animales, 2020, numéro 2
100 / Pauline ezanno et al.

Figure 2. L’IA au service de la modélisation mécaniste en épidémiologie (Source :                                blages de prions, permettant ainsi un
EMULSION, Picault et al., 2019b).                                                                                diagnostic plus précoce de ces mala-
                                                                                                                 dies animales de type neurodégénéra-
                                                                                                                 tives, et ouvrant la voie pour identifier
                                                                                                                 des cibles thérapeutiques potentielles
                                                                                                                 (Chyba et al., 2016). En santé humaine,
                                                                                                                 on a assisté dans la seconde moitié du
                                                                                                                 xxe siècle à un développement consé-
                                                                                                                 quent de nouvelles disciplines aux
                                                                                                                 interfaces entre IA et disciplines-phares,
                                                                                                                 notamment la biologie cellulaire et l’im-
                                                                                                                 munologie. Des disciplines d’interface
                                                                                                                 se sont développées, comme la biologie
                                                                                                                 et l’immunologie computationnelles,
                                                                                                                 qui doivent aujourd’hui fertiliser les dif-
                                                                                                                 férents secteurs de la SA. L’immunologie
                                                                                                                 humaine actuelle repose sur la descrip-
                                                                                                                 tion de mécanismes moléculaires et
                                                                                                                 cellulaires fins (par exemple le nombre
                                                                                                                 d’interleukines connues aujourd’hui a
                                                                                                                 augmenté de manière considérable par
                                                                                                                 rapport aux années 1970). La volonté
                                                                                                                 de comprendre les processus sous-
                                                                                                                 jacents aux réponses immunitaires a
                                                                                                                 provoqué une révolution en invitant
                                                                                                                 cette discipline à s’intéresser à la bio-
                                                                                                                 logie des systèmes complexes et aux
                                                                                                                 approches issues de l’IA (Bassaganya-
                                                                                                                 Riera et Hontecillas, 2016). Toutefois,
                                                                                                                 les déséquilibres entre les effectifs
                                                                                                                 d’immunologistes et de modélisateurs
                                                                                                                 en immunologie constituent un frein
                                                                                                                 à l’essor pourtant fantastique de cette
                                                                                                                 nouvelle discipline.

                                                                                                                 3. Revisiter les méthodes
                                                                                                                 de détection de cas
                                                                                                                 à différentes échelles

A. Les modélisateurs développent chaque modèle épidémiologique de novo, et produisent des codes                    Une gestion rationnelle des troubles
spécifiques non lisibles par des scientifiques d’autres disciplines ou par les utilisateurs finaux des           de santé en élevage repose sur des
prédictions.                                                                                                     méthodes performantes de détection
B. Mobiliser des approches d’IA pour combiner un langage dédié et une architecture logicielle à base
d’agents contribue à rendre les modèles épidémiologiques plus reproductibles, transparents, flexibles, et
                                                                                                                 de cas, que ce soit à l’échelle indivi-
transférables aux gestionnaires de la santé sous forme d’outils d’aide à la décision. Un simulateur interprète   duelle voire infra-individuelle (organe),
les fichiers textes décrivant le système pour produire le code du modèle. Des briques complémentaires            du groupe d’animaux, ou de territoires.
de code peuvent être ajoutées si nécessaire.                                                                     Les méthodes d’apprentissage per-
                                                                                                                 mettent de détecter des patrons et
(données issues du séquençage massif                     lome (Tardivel et al., 2017). Par ailleurs, le          des signaux dans les grandes masses
et de la métagénomique). Des voies de                    temps de diagnostic est réduit en facili-               de données, et en particulier dans les
signalisation métabolique, physiolo-                     tant les analyses d’images (par exemple                 séries spatiales ou temporelles de cas
gique ou immunologique sont explo-                       la détection accélérée de patrons cli-                  en santé, et contribuent ainsi à l’essor
rées et des métabolites sont identifiés                  niques, Dórea et al., 2013), souvent                    d’une agriculture intelligente et de la
et quantifiés dans des mélanges biolo-                   nécessaires pour étudier les interac-                   télémédecine. Des alertes peuvent être
giques complexes. Cet aspect consti-                     tions hôte-pathogènes en pathologie                     produites, et contribuer aux conseils
tuait jusqu’alors un défi majeur pour                    animale. Par exemple, l’utilisation de                  de gestion en agriculture numérique
tester a priori des hypothèses liées à la                méthodes optimales a permis de mieux                    (Liakos et al., 2018 ; figure 3) ou dans
caractérisation exhaustive du métabo-                    comprendre la formation des assem-                      la pratique vétérinaire (Jones-Diette

INRAE Productions Animales, 2020, numéro 2
Intelligence artificielle et santé animale / 101

Figure 3. Les données massives en élevage.                                                                 (Forbes et al., 2013 ; Perez et al., 2009)
                                                                                                           ou leurs proxies (ex : émergence de
     Externe             Météo                                                                             maladies infectieuses suite aux pertur-
                         Paysage                                                                           bations de l’environnement), ou encore
     Exploitation        Bâtiment                                                                          des symptômes et voies métaboliques
                         Ambiance                       Données                   Modèles                  en cascades précurseurs de patholo-
                         Détention                      massives                  prédictifs               gies chroniques ou dégénératives. L’IA
                         Commerce                                                                          permet aussi de mobiliser les informa-
     Animal              Santé                                                                             tions disponibles sur Internet, par des
                         Performances                                 Alertes                              méthodes semi-automatiques de fouille
                         Comportement                                                                      de textes (data mining) pour identifier
                                                           !
                         Alimentation
                                                                                                           et traiter des signaux d’émergence pour
                         Génétique
                                                                                 Modèles                   la veille internationale sur les maladies
                                                         Éleveur
                                                                                mécanistes                 animales infectieuses (Arsevska et al.,
                                                                                                           2018).
                                                                        Outils d’aide
                                                       Conseillers                                            À large ou très large échelle (terri-
                                                                         au conseil
                                                                                                           toire, pays, continent…), l’analyse des
L’analyse des données massives par des modèles prédictifs (ex : par apprentissage) permet de générer
des alertes destinées aux éleveurs. Intégrer de manière automatique ces données ou les alertes produites   données de mouvements commerciaux
dans des modèles mécanistes permettrait de proposer des outils logiciels d’aide au conseil innovants       d’animaux entre élevages (Dutta et al.,
pour les gestionnaires de la santé, qui soient adaptés aux particularités locales.                         2014 ; figure 4) permet de prédire le
                                                                                                           risque épidémique associé (Hoscheit
                                                                                                           et al., 2016). Ces mouvements sont dif-
et al., 2019). Cela aboutit parfois à une             transposition à un autre pathosystème                ficilement prévisibles, notamment car
détection plus précoce des troubles de                ou la prise en compte d’évolutions envi-             les échanges commerciaux reposent
santé et contribue à la rationalisation               ronnementales ou réglementaires est                  sur de nombreux facteurs associés
des traitements anti-infectieux (notam-               hasardeuse. Par ailleurs, si les méthodes            aux activités et décisions humaines.
ment antibiotiques) chez les animaux                  d’apprentissage (classification, analyse             Des méthodes de reconnaissance
de production. Cela peut reposer sur                  d’images, reconnaissance de formes,                  de patrons spatio-temporels et des
l’analyse de données collectées à par-                fouille de données…) apportent des                   développements méthodologiques
tir d’objets connectés (Morota et al.,                solutions pour un large panel de                     pour l’analyse de graphes relationnels
2018), le typage de la santé individuelle             questions de recherche en bioméde-                   dynamiques orientés et pondérés sont
ou de groupe (Dórea et al., 2013), voire              cine et biosanté, il est crucial de bien             requis dans ce domaine car très peu des
des modèles mécanistes prédictifs de                  démontrer par des méthodes de vali-                  méthodes permettent à ce jour d’étu-
l’occurrence des détections de nou-                   dation éprouvées la performance de                   dier des systèmes à grande échelle alors
veaux cas à traiter (Picault et al., 2019a).          ces méthodes en mesurant leur qualité                que les jeux de données sont souvent
Ensuite, une optimisation multicritère                prédictive et en les comparant lorsque               de très grande taille (plusieurs dizaines
permet de raisonner les stratégies thé-               c’est possible aux méthodes statistiques             voire centaines de milliers d’exploita-
rapeutiques en identifiant qui traiter                alternatives.                                        tions en interaction dynamique).
dans un groupe, quand, selon quel
protocole et pendant quelle durée, de                    À l’échelle des populations, la détec-
manière à maximiser la probabilité de                 tion de cas repose sur une surveillance
                                                                                                           4. Cibler les interventions,
guérison tout en minimisant le risque                 directe (détection des troubles) ou                  intégrer l’humain
de résistance et les doses utilisées                  indirecte, mobilisant des informations               au système et soutenir
(médecine individualisée et médecine                  connexes (proxies) à l’occurrence des                ses décisions
de précision).                                        troubles. Ainsi, l’émergence de certaines
                                                      maladies est détectée par une surveil-
   Néanmoins, la qualité des alertes                  lance syndromique, en détectant des
                                                                                                           „ 4.1. Choisir parmi
reste assujettie à la qualité et à la                 signaux anormaux dans des données
                                                                                                           toutes les alternatives
représentativité des jeux de données                  collectées en routine (mortalité, repro-               Un enjeu des gestionnaires de la santé
utilisés par les algorithmes d’appren-                duction, comportement, production lai-               est d’identifier les combinaisons de
tissage. De nombreux biais (d’origine                 tière, utilisation médicamenteuse plus               mesures de maîtrise les plus pertinentes
matérielle, logicielle, humaine) peuvent              importante… ; Marceau et al., 2014).                 selon les spécificités locales (caractéris-
entacher le bien-fondé des prédictions.               Ici les méthodes d’IA et les statistiques            tiques des élevages, objectifs de pro-
De plus, des alertes produites après un               sont fortement complémentaires,                      duction…) et territoriales (ressources
apprentissage reflètent nécessaire-                   devant s’appuyer sur un large panel de               collectives disponibles, localisation
ment les spécificités du système dont                 données, fortement hétérogènes, par-                 des élevages, priorités de gestion…),
les données sont issues (lieu, période,               fois massives et souvent éparses, pour               pour anticiper les effets de change-
pratiques d’élevage…), de sorte qu’une                détecter des signaux souvent faibles                 ments sanitaires, environnementaux

                                                                                                           INRAE Productions Animales, 2020, numéro 2
102 / Pauline ezanno et al.

Figure 4. Mouvements commerciaux de bovins en France en 2009 (Source : Base                          „„4.2. Tenir compte
de données nationale d’identification des bovins – BDNI).                                            des attentes et des peurs
                                                                                                     des gestionnaires de la santé

                                                                                                        Les gestionnaires de la santé ani-
                                                                                                     male doivent disposer des prédictions
                                                                                                     issues de modèles dans un temps com-
                                                                                                     patible avec les besoins de gestion.
                                                                                                     Face à des émergences imprévisibles
                                                                                                     (nouveaux pathosystèmes, nouvelles
                                                                                                     conditions de circulation, mesures de
                                                                                                     maîtrise à déterminer…), cela peut
                                                                                                     s’avérer problématique. Envisager une
                                                                                                     bibliothèque de modèles ayant un
                                                                                                     cadre commun renforcerait la réacti-
                                                                                                     vité des épidémiologistes, permettant
                                                                                                     de développer des modèles pertinents
                                                                                                     plus rapidement et de les mettre à jour
                                                                                                     avec des données actualisées (« real-
                                                                                                     time system modeling ») lors de la pro-
                                                                                                     gression des épidémies. Néanmoins, si
                                                                                                     cela accélèrerait le passage du modèle
                                                                                                     conceptuel (dérivé des connaissances
                                                                                                     et des hypothèses biologiques sous-
                                                                                                     jacentes) à l’outil d’aide à la décision, un
                                                                                                     gain de réactivité serait encore obtenu
                                                                                                     par la génération automatique de code
Ces mouvements forment un réseau dynamique, orienté et pondéré. Le prédire est un challenge
scientifique et technique, pour lequel de nouvelles méthodes sont requises et auquel l’IA pourrait   informatique performant et l’adapta-
contribuer.                                                                                          tion de code en autonomie ; ce qui reste
                                                                                                     à ce jour un verrou méthodologique
                                                                                                     important à lever en IA. Par ailleurs, il est
et ­réglementaires, et promouvoir des              in silico d’évaluer, comparer, ­hiérarchiser      souvent ­nécessaire de réaliser un très
conseils sanitaires de qualité. La ques-           un large panel d’options à moindre                grand nombre de calculs ou d’analyser
tion se pose aussi de comment favoriser            coût (figure 5 ; Beaunée et al., 2017).           de très grandes bases de données, ce
l’innovation en SA, par exemple anti-              Cependant, la plupart des modèles                 qui appelle à une utilisation raisonnée
ciper les caractéristiques requises de             disponibles n’intègre pas explicitement           des ressources informatiques. Ainsi, les
molécules candidates (Schneider, 2019),            l’humain et sa décision, alors que les            outils logiciels transférés vers les ges-
ou évaluer l’avantage concurrentiel de             décisions de maîtrise sont souvent de             tionnaires requièrent parfois l’usage
stratégies innovantes (sélection géno-             l’initiative des éleveurs (ex : maladies          de ressources privées de type cloud
mique d’animaux résistants, nouveaux               non réglementées), avec des consé-                (logiciels qui ne fonctionnent pas sur
vaccins…) par rapport aux stratégies               quences sanitaires et décisionnelles              de simples ordinateurs), mettant en
conventionnelles. Les gestionnaires                parfois à large échelle (diffusion infec-         exergue le compromis entre coût de
privés (éleveurs, conseillers des éle-             tieuse, diffusion de l’information et             simulation, continuité de service (par
veurs) et collectifs (groupements d’éle-           des rumeurs, zone d’influence…). Des              exemple la gestion des pannes) et
veurs, pouvoirs publics…) ont besoin               travaux récents visent à intégrer l’hu-           temps requis pour obtenir les résultats
d’outils d’aide à la décision (OAD) pour           main et ses décisions dans le système             de simulations (Pham et al., 2017). Ces
cibler les incitations publiques, iden-            en mobilisant du contrôle optimal et              questions relèvent pour l’heure de la
tifier les investissements à privilégier           des stratégies adaptatives issues de              recherche en informatique, et des col-
par l’éleveur (Ezanno et al., 2018) et             l’IA (Viet et al., 2018) ou encore des            laborations sont souhaitables entre ces
cibler au mieux les mesures : qui cibler           méthodes d’économie de la santé (Tago             chercheurs et ceux de SA.
(quels élevages, quels animaux) ? avec             et al., 2016 ; Krebs et al., 2018). Ces tra-
quelle(s) mesure(s) ? quand et pendant             vaux sont précurseurs en SA et doivent               Les gestionnaires souhaitent aussi
combien de temps ? etc. Ces questions              être poursuivis et étendus dans le cadre          s’appuyer sur des prédictions précises
deviennent incontournables pour rai-               du développement de l’agroécologie,               provenant de représentations réalistes
sonner l’usage des intrants (antibio-              de la demande sociétale actuelle en               des systèmes biologiques. Avant d’être
tiques, pesticides, biocides…).                    matière de qualité des produits et de             utilisés, le comportement des modèles
                                                   respect des écosystèmes et de leur                doit être analysé. Se posent alors les
  Le recours à la modélisation méca-               biodiversité, et plus généralement de             questions d’exploration dans l’espace
niste est une solution qui permet                  la sécurité sanitaire internationale.             des incertitudes et des données, et

INRAE Productions Animales, 2020, numéro 2
Intelligence artificielle et santé animale / 103

Figure 5. Identifier les stratégies pertinentes pour maîtriser la paratuberculose                              demain, pour quels objectifs ? Dans
bovine à l’échelle régionale (d’après Beaunée et al., 2017).                                                   un esprit de surveillance contrôlée,
                                                                                                               ces OAD ne risquent-ils pas d’entraî-
                                                                                                               ner une dérive de discrimination des
                                                                                                               élevages selon leur statut sanitaire,
                                                                                                               même lorsque ce statut sanitaire ne
                                                                                                               peut être géré par les seules interven-
                                                                                                               tions de l’éleveur ? Les nouvelles tech-
                                                                                                               nologies issues de l’IA peuvent en effet
                                                                                                               revêtir un caractère double, offrant par
                                                                                                               exemple la possibilité d’un contrôle
                                                                                                               des cheptels par des groupes interna-
                                                                                                               tionaux de l’agro-alimentaire parfois
                                                                                                               propriétaires des données collectées.
                                                                                                               Deuxièmement, il existe aussi en SA
                                                                                                               une crainte de voir l’outil remplacer
                                                                                                               l’expertise humaine. Pourtant, auto-
                                                                                                               matiser ne signifie en rien remplacer
                                                                                                               l’humain, son expertise et sa décision
                                                                                                               (Reddy et al., 2019). Il s’agit plutôt de
Classiquement, identifier les stratégies pertinentes revient à les définir a priori puis à les comparer, par   renforcer ses capacités d’abstraction
exemple par modélisation. Généralement, seul un faible nombre d’alternatives est considéré. Ici, toutes        et d’analyse, accélérer le processus
les alternatives sont considérées, aboutissant à une multitude de scénarios dont l’analyse peut devenir
un challenge. Chaque point correspond à la situation épidémiologique après 9 ans de propagation du
                                                                                                               global, fiabiliser les prédictions, gui-
pathogène sur un réseau de 12 500 troupeaux bovins laitiers pour une stratégie donnée (astérisque :            der les recherches complémentaires.
pas de maîtrise). Initialement, 10 % des animaux sont infectés en moyenne dans 30 % des troupeaux.             Néanmoins, un développement impor-
Les points les plus bleus correspondent aux stratégies les plus favorables. Mobiliser dans un tel cadre        tant des ressources et matériels infor-
des approches d’IA, notamment d’optimisation sous contraintes, faciliterait l’identification des stratégies    matiques n’est pas sans impacts sur
pertinentes en explorant l’espace des possibles de manière plus ciblée.
                                                                                                               l’environnement en termes de bilan
                                                                                                               carbone (serveurs énergivores, recy-
d’optimisation sous contraintes. Cela                   ii) inférer des processus et des proprié-              clage des capteurs…), ce qu’il faut
requiert souvent des simulations                        tés émergentes. Des développements                     aussi prendre en compte dans le cadre
intensives, qui bénéficieraient d’algo-                 méthodologiques sont encore requis                     du développement de l’agroécologie.
rithmes d’optimisation pour parcourir                   et qui bénéficieraient à de nombreuses                 Troisièmement, la très grande com-
plus efficacement l’espace des pos-                     problématiques de santé, notamment                     plexité d’analyse et d’acculturation
sibles. En retour, cela permettrait par                 en lien avec les notions actuellement                  des résultats et connaissances issus
exemple d’identifier automatiquement                    en pleine évolution de réservoir-hôte,                 de la recherche académique, notam-
comment atteindre un objectif fixé                      d’hôte relais (« edge-host »), et de bar-              ment de l’IA, constitue un obstacle à
(ex : réduction de la prévalence d’une                  rière d’espèces (Han et al., 2019). Les                l’appropriation des OAD par leurs utili-
maladie sous un seuil acceptable) tout                  développements méthodologiques                         sateurs et peut conduire à préférer des
en tenant compte des ressources dis-                    et la diffusion des méthodes exis-                     méthodes plus simples et faciles d’ac-
ponibles. Si cette question trouve des                  tantes sont à poursuivre (par exemple                  cès. Toutefois, ces dernières peuvent
solutions en statistique moderne pour                   le réseau français pluri-organismes                    se révéler ne pas toujours être les plus
des systèmes relativement simples, elle                 Mexico : « Méthodes pour l’EXploration                 pertinentes ou les plus fiables. Des pro-
représente un front de science pour les                 Informatique des modèles Complexes »                   jets de science participative (« citizen
systèmes complexes (large échelle, mul-                 organise des écoles-chercheurs sur                     science »), aussi nommée participa-
ti-hôtes, multi-pathogènes, multi-sys-                  « Analyse de sensibilité, métamodéli-                  tion communautaire en épidémiolo-
tèmes…) qui deviennent la norme.                        sation et optimisation de modèles »,                   gie humaine (« community health »),
De plus, des objectifs d’optimisation                   https://reseau-mexico.fr/).                            permettront en SA de co-concevoir et
spécifiques à la SA peuvent engen-                                                                             co-construire les OAD de demain avec
drer des besoins méthodologiques                           Enfin, trois limites ont été identi-                leurs utilisateurs. Cet effet d’entraîne-
ad hoc (Shah et al., 2019). Les besoins                 fiées quant au développement d’OAD                     ment permettra de mieux répondre
en capacité d’abstraction et d’analyse                  pour les gestionnaires de la santé, liés               aux attentes et aux besoins des uti-
sont massifs et pourraient bénéficier                   à l’acceptabilité de l’IA au sens large                lisateurs mais aussi des citoyens, de
des complémentarités entre IA (explo-                   comme facteur majeur de progrès                        rendre moins opaques les systèmes et
ration raisonnée, utilisation intelligente              (Prospective, 2019). Premièrement, les                 les approches informatiques, et d’ac-
des ressources informatiques, calculs                   questions d’éthique, flagrantes lors-                  croître leur confiance dans les prédic-
optimisés…) et statistiques pour tirer                  qu’il s’agit de santé humaine, sont aussi              tions de modèles académiques parfois
autant d’information que possible des                   importantes à prendre en compte en                     obscurs, notamment lorsqu’ils ne sont
données : i) explorer, analyser, prédire ;              SA. Quels OAD souhaitons-nous pour                     pas lisibles (lignes de code sans filtre).

                                                                                                               INRAE Productions Animales, 2020, numéro 2
Vous pouvez aussi lire