Intelligence artificielle et santé animale - productions ...
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
Intelligence artificielle INRAE Prod. Anim., 2020, 33 (2), 95-108 et santé animale Pauline EZANNO1, Sébastien PICAULT1, Nathalie WINTER2, Gaël BEAUNÉE1, Hervé MONOD3, Jean-François GUÉGAN4,5,6 1 INRAE, Oniris, BIOEPAR, 44300, Nantes, France 2 INRAE, ISP, Tours, France 3 INRAE, MaIAGE, Jouy-en-Josas, France 4 INRAE, CIRAD, UM, ASTRE, Montpellier, France 5 IRD, CNRS, UM, MIVEGEC, Montpellier, France 6 Programme international FutureEarth du programme des Nations unies pour l’environnement, Global research programme oneHEALTH, Paris hub, France Courriel : pauline.ezanno@inrae.fr Les recherches à l’interface entre Santé Animale (SA) et Intelligence Artificielle (IA) sont en plein essor. Elles permettent de s’engager sur de nouveaux fronts de science en SA, de lever des verrous méthodologiques et d’identifier les défis de demain en agriculture. Portés par le regain d’intérêt récent pour l’IA, de nouveaux outils d’aide à la détection en médecine animale et d’aide à la gestion sanitaire émergent, ouvrant des horizons nouveaux pour la sécurité sanitaire. Introduction infrastructures de calcul, l’apprentis- manière plus réaliste, l’aide à la décision sage devient profond (« deep learning »), humaine (systèmes experts, aide au dia- L’IA correspond à un large ensemble i.e. explore ces données massives que gnostics, allocation de ressources…). de théories et technologies mobilisées ne peuvent traiter les méthodes sta- Pour cela, un large panel de concepts pour résoudre des problèmes de forte tistiques. Par ailleurs, des algorithmes et méthodes sont développés en IA complexité logique ou algorithmique apprenant sont développés, abou- (FranceIA, 2017), parmi lesquels les (Villani, 2018). Nous retiendrons ici tissant par exemple aujourd’hui aux méthodes d’apprentissage, mais aussi une acception large de l’IA, en tenant réseaux de neurones artificiels et aux les méthodes de résolution de pro- compte des interactions et complémen- machines vecteur support (SVM). Les blèmes complexes, d’automatisation tarités avec les disciplines connexes que développements récents se sont nour- de tâches ou de raisonnements, d’in- sont l’informatique, l’algorithmique, ris des interfaces créées entre l’IA et les tégration d’informations provenant de les mathématiques et les statistiques. autres disciplines, comme par exemple sources hétérogènes, ou encore d’aide Concept introduit dans les années 1950, la biomédecine, ainsi que des données à la décision (figure 1). notamment par A. Turing, nombre de massives issues de différents champs méthodes ont été développées ou disciplinaires, notamment associés à la Une partie des recherches menées étendues relativement récemment santé (Hosny et al., 2018 ; Karczewski et aux fronts de science en SA prend une avec l’amélioration des performances Snyder, 2018). ampleur nouvelle en mobilisant de telles des ordinateurs. Ainsi, l’apprentissage méthodes d’IA, mais aussi par le déve- automatique (« machine learning ») se L’IA s’attache à adresser trois défis loppement de données massives. Ainsi, développe dès les années 1980. Une des qui font également sens en SA : i) la les recherches en SA bénéficient des méthodes de l’IA les plus connues du compréhension d’une situation et de avancées sur les méthodes d’appren- grand public, elle correspond à analyser sa dynamique, telle qu’une dynamique tissage, par exemple en épidémiologie des données pour en déduire des règles épidémique ; ii) la perception de l’en- prédictive, en médecine de précision à suivre, voire permet de s’autocorriger vironnement qui se traduit en SA par individualisée, et dans l’étude des rela- avec l’arrivée de nouvelles données. À la détection de patrons, de formes ou tions hôtes × pathogènes (Zhang et al., partir des années 2000, avec l’essor des de signaux à différentes échelles ; iii) la 2017 ; Karczewski et Snyder 2018). Ces données massives (« big data ») et des prise de décision par l’ordinateur, ou, de méthodes facilitent le diagnostic et la https://doi.org/10.20870/productions-animales.2020.33.2.3572 INRAE Productions Animales, 2020, numéro 2
96 / Pauline ezanno et al. Figure 1. Structure de l’article et positionnement de quelques thèmes de recherche en santé animale (en noir) et de concepts et méthodes d’intelligence artificielle utiles pour les développer (en vert). Apprentissage automatique Diagnostic Classification automatique Télémédecine Collecte DÉTECTION Systèmes experts Médecine de précision Organisation §3 Reconnaissance Surveillance de formes Accès partagé Intégration Biologie fondamentale automatique COMPRÉHENSION Épidémiologie d’informations §2 hétérogènes Phylodynamique DONNÉES Systèmes Multi-Agents §1 Représentation Décisions, conseils des connaissances PRÉVISIONS / Gestion adaptative Génération SCÉNARISATION §4 Innovations automatique de code Résolution de problèmes complexes détection de cas, fiabilisent les prédic- l’IA, pour partie sur des thématiques particuliers (pathogènes partagés tions et réduisent les erreurs, accélèrent communes avec la santé humaine, comme pour la peste porcine afri- les décisions, améliorent la précision pour partie du fait des spécificités des caine, passage de la barrière d’espèce des analyses de risque et permettent recherches en SA (Ducrot et al., 2011), facilitée par des contacts fréquents). de mieux cibler les interventions (Saria et qui peuvent constituer des verrous L’intensité de ces interactions pourrait et al., 2018). Les recherches en SA béné- particuliers. Premièrement, le contexte croître du fait des actions seules ou ficient aussi d’avancées scientifiques en agro- et socio-économique est crucial combinées des pressions environne- IA sur la représentation des connais- pour ces systèmes biologiques gérés mentales (artificialisation des terres sances et la modélisation des raisonne- par l’humain et sources de revenus et occupation par le bétail), démogra- ments (Bedi et al., 2015), des processus (animaux de rente), et qui sont forte- phiques (demande mondiale crois- décisionnels et de gestion de l’incerti- ment soumis aux attentes sociétales sante en productions animales) et tude (Lynn, 2019), sur les parcours de en termes d’éthique et de bien-être sociétales (conduite en plein air du vie des patients (Pinaire et al., 2017), en animal (Connehaye et Duée, 2015). bétail). Vu sous un autre angle, travail- résolution de problèmes avec allocation Les mesures conventionnelles de maî- ler sur des réseaux de maladies mul- de ressources sous contrainte (Vrakas trise des maladies animales peuvent ti-espèces fournit des informations et Vlahavas, 2008), sur les agents auto- ne plus être acceptables (par exemple cruciales sur les mécanismes molécu- nomes (Shakshuki et Reid, 2015) et les l’abattage sanitaire, l’utilisation d’an- laires sous-jacents (Anvar et al., 2011). systèmes multi-agents (Roche et al., tibiotiques ; Hur et al., 2019). Des Troisièmement, les populations ani- 2008) voire multi-niveaux (Picault et alternatives doivent être identifiées et males sont soumises à des prises de al., 2017), ainsi que sur la génération évaluées, et l’IA peut y contribuer. Par décision récurrentes qui concernent automatique de code informatique exemple, le recours à une médecine aussi la gestion de la santé (commerce, (Russell et Norvig, 2010). Ces avancées vétérinaire individualisée est une alter- mesures de maîtrise…) notamment méthodologiques permettent ainsi des native qui mobilise des méthodes d’IA pour les maladies non réglementées représentations plus réalistes et lisibles ainsi que des données différentes de (décisions adaptatives des éleveurs). par des non informaticiens de systèmes celles de la santé humaine (Behmann Les critères économiques et l’impact biologiques complexes tels que ren- et al., 2016). L’intégration des données sur le revenu des éleveurs sont alors contrés en SA, ainsi que la production issues du séquençage massif en SA, des indicateurs incontournables pour de modèles pour anticiper l’effet de incluant les technologies émergentes évaluer les stratégies de maîtrise, par- décisions de maîtrise ou de conduite à d’étude du métabolome et de l’épigé- fois en contradiction avec les attentes différentes échelles (animal, troupeau, nome, est aussi un challenge à relever sociétales. Toutes ces spécificités font région…). rapidement (Suravajhala et al., 2016 ; de l’interface entre IA et SA un thème Goldansaz et al., 2017). Deuxièmement, d’intérêt pour stimuler de nouveaux Mener des travaux de recherche à les interactions entre espèces, notam- travaux méthodologiques et lever l’interface entre IA et SA conduit aussi à ment entre faune domestique et sau- certains des verrous auxquels sont identifier de nouveaux challenges pour vage, entraînent des risques infectieux confrontés les recherches en SA. INRAE Productions Animales, 2020, numéro 2
Intelligence artificielle et santé animale / 97 Sur la base d’une revue de la littéra- Encadré 1. Analyse bibliométrique systématique. ture des articles scientifiques à l’inter- face entre IA et SA publiés entre 2009 Les publications ont été recherchées dans PubMed et ISI Web of Knowledge pour la période allant de 2009 et 2019 (encadré 1), complétée d’en- à 2019. Les mots-clés ont été recherchés dans les titres, mots-clés auteurs et résumés des publications. tretiens conduits avec des chercheurs Seuls les articles en anglais ont été conservés. Dans ISI Web of Knowledge, toutes les bases de données ont et enseignants-chercheurs français été mobilisées, mais les catégories de recherche visiblement en dehors de la thématique ont été retirées positionnés à cette interface (enca- pour limiter le nombre de résumés à parcourir. Les doublons ont été retirés (mêmes auteurs, titre, année, dré 2), nous avons déterminé les grands support) lors de la lecture des titres et résumés. domaines de recherche en SA dans les- quels l’IA était aujourd’hui mobilisée Mots-clés recherchés : (health OR disease OR pathogen OR epidem*) AND (“artificial intelligence” OR (figure 1). Nous avons exploré com- “machine learning” OR “multi-agent” OR “multilevel agent” OR “markov decision process” OR “hidden mar- ment les méthodes d’IA contribuent à kov”) AND (animal OR livestock OR cattle OR pig OR poultry OR wildlife) NOT cancer. revisiter les questions de recherche en SA et permettent de lever des verrous Les publications visiblement hors thème à la lecture des titres et résumés ont été retirées, puis à nouveau méthodologiques. Nous avons égale- à la lecture des articles. D’autres publications qui ne ressortaient pas sur ces bases de données mais ment analysé comment des questions connues des auteurs pour être dans ce thème (connaissance des travaux des équipes concernées par ces de recherche en SA interrogent et sti- publications) ont été rajoutées. Au final, 110 publications ont été retenues (tableau 1). La liste de ces mulent de nouveaux travaux en IA. références est disponible sur demande. Nous nous attacherons ici à discuter de la collecte, de l’organisation et de l’ac- cessibilité aux données en SA (partie 1), Tableau 1. Sélection des articles publiés à l’interface entre intelligence artificielle puis à discuter comment les méthodes et santé animale. d’IA nous permettent de revisiter notre compréhension des pathosystèmes Base de données « PubMed » « Web of Knowledge » Total (partie 2), à améliorer la détection de cas et le diagnostic à différentes Nombre d’articles identifiés 128 395 * échelles (partie 3), et à prévoir et scé- nariser le devenir des pathosystèmes Sélection sur titres et résumés 35 58 77 pour en améliorer la gestion, faciliter les prises de décision, et stimuler les Références complémentaires 33 innovations (partie 4). Enfin, nous dis- cuterons des freins et leviers possibles Publications retenues 110 au développement de l’IA en SA (par- Il existait des doublons entre les deux bases de données, le total n’est donc pas calculable avant lecture * tie 5), avant de conclure sur des recom- des titres et résumés des publications. mandations pour se saisir au mieux des enjeux que représente cette interface SA/IA (partie 6). rature corporelle, production et com- troupeaux lors de programmes de suivi position du lait, reproduction, poids, de cohortes par exemple ; iii) réglemen- 1. Collecter, organiser alimentation…) ou ses caractéris- tairement (mouvements commerciaux et rendre accessibles tiques propres (données génomiques, des bovins, plateforme d’épidémio-sur- des données de qualité métaboliques…). Certaines données veillance) ; iv) par des entreprises pri- existent déjà (mais ne sont pas toujours vées (mouvements des porcs, collecte accessibles aux académiques), d’autres du lait), et v) de manière ad hoc dans Un point central pour les recherches (métabolome par exemple) repré- le cadre de projets de recherche. Cette en SA reste le lien aux données d’obser- sentent un enjeu dont il convient de se caractéristique entraîne une très grande vation, lesquelles sont structurées entre saisir. Le processus de mondialisation et diversité de propriétés des données, et échelles d’organisation du vivant, ainsi d’échanges d’animaux à large échelle donc de leur gestion, accès et usages qu’entre échelles spatio-temporelles conduit aussi à inclure le niveau global possibles. (Ezenwa et al., 2015). Les données dans les recherches en épidémiologie d’intérêt sont diverses : elles peuvent quantitative et plus généralement en Il convient de réfléchir aux futurs concerner des zones plus ou moins SA (transferts d’agents infectieux, géné- systèmes d’observation, de collecte et grandes, des troupeaux, ou des groupes tique et gestion des races…). de gestion de ces données, et aux pra- d’animaux (données épidémiologiques, tiques visant à une meilleure collabo- de détention d’animaux et de mouve- L’ensemble de ces données massives ration entre les parties-prenantes. Si la ments commerciaux, météorologiques, et hétérogènes peuvent être collectées : gestion des données a toujours été un parcellaires…). Elles peuvent aussi i) automatiquement (capteurs, sys- élément important en recherche finali- concerner l’animal lui-même, en lien tèmes de vidéo-surveillance…) ; ii) spé- sée pour faciliter leur utilisation et leur avec le système de production (tempé- cifiquement pour certains animaux ou valorisation, il s’agit aujourd’hui d’une INRAE Productions Animales, 2020, numéro 2
98 / Pauline ezanno et al. Encadré 2. Conduite des entretiens. Toutes les unités du Département Santé Animale (DSA) d’INRAE ont été contactées. Des personnes ont été ciblées sur avis des directeurs d’unité et des membres du groupe de travail. Des entretiens complémentaires ont été menés dans d’autres départements d’INRAE et hors d’INRAE, pour avoir une vision plus précise des forces et compétences en présence en France à l’interface IA/SA, de l’intérêt des scientifiques pour cette interface, et des illustrations de collectifs organisés à une interface comparable (dans le domaine de la santé s.l.). À INRAE, au sein du DSA, ont été contactés : C. Citti, I. Oswald, P. Martin, D. Concordet et A. Bousquet-Mélou (Toulouse), S. Picault, G. Beaunée, A. Madouasse et P. Ezanno (Nantes), N. Winter (Tours), projet CaSciModOT (région Val-de-Loire), J.-F. Guégan (Montpellier). Au sein du département Mathématiques et Informatique Appliquées (MIA), ont été contactés : H. Monod (Chef du Département, Jouy-en-Josas), F. Garcia et T. Schiex (Toulouse), E. Vergu (Jouy-en-Josas). Par ailleurs, ont été contactés : C. Lannou (Chef du Département Santé des Plantes et Environnement (SPE), Jouy-en-Josas), C. Bastien (Chef du Département Ecologie des Forêt, Prairies et milieux Aquatiques (EFPA), Grand-Est-Nancy), et A. Franc (EFPA, Bordeaux), ainsi que R. Thiébaut (Inserm/Inria, Bordeaux), Charline Smadi (Irstea, Grenoble), et Maguelonne Teisseire (Irstea, Montpellier). Les entretiens abordaient les points suivants : – Quelles recherches menées dans l’équipe en lien avec l’IA ? Quelle plus-value pour les recherches en SA ? Quel positionnement par rapport à la liste des thèmes retenus ? – Ces recherches sont-elles menées en collaboration ? Quelles compétences clés sont mobilisées ? – Quel est le principal verrou (données, compétences, méthodes, collaborations…) ? – Quel front de science à cette interface IA/SA ? Positionné en SA (on peut aborder de nouvelles questions ou revisiter des questions) ou en IA (développement de nouvelles méthodes, nouveaux concepts) ? – Quel exemple concret pour illustrer le propos ? – Qui d’autre devrions-nous contacter ? Les thèmes en IA retenus étaient les suivants : – Représentation des connaissances : langage domaine-spécifique, ontologie. – Méta-modélisation symbolique ou numérique, génération automatique de code informatique, adaptation de code en autonomie. question stratégique tant en recherche données de SA (dualité entre la notion à plus grande échelle des solutions théorique que plus appliquée couplée de bien public et le caractère priva- innovantes et accélérerait leur mise au aussi à un challenge technique (Pfeiffer tif de certaines données) pour rendre point et leur évaluation. Une expertise et Stevens, 2015). Il apparaît nécessaire possible l’expérimentation en situations conséquente existe (plateforme de de rendre interopérables les sources réelles et comparer les performances données épidémiologiques, grandes hétérogènes de données, requérant des algorithmes d’IA (Prospective, cohortes, fermes expérimentales, zones des développements méthodologiques 2019) ? Lever ces interrogations facili- ateliers…) qui pourrait être mise à pro- dédiés. Par ailleurs, une grande partie terait aussi la collecte de données ad fit. De plus, l’IA pourrait contribuer à des données relève de la sphère privée, hoc. L’IA, notamment par les systèmes revisiter les méthodes d’échantillon- avec une propriété à caractère souvent experts et les systèmes multi-agents, nage pour la collecte de données de hétérogène (propriétaires multiples, aide à construire une représentation terrain en santé et en épidémio-sur- données non centralisées, données fer- réaliste de systèmes biologiques com- veillance animale, en ciblant mieux et mées), et parfois floue (méconnaissance plexes et se révèle ainsi un outil effi- de manière dynamique les données à du propriétaire réel de la donnée entre, cace pour favoriser la participation des collecter tout en évitant les données par exemple, l’éleveur et le collecteur acteurs d’une filière donnée à la prise de colinéaires redondantes. des données) ; ce qui tend à complexi- décision optimisée, voire l’évaluation de fier grandement l’accès aux données, l’impact de modifications des usages et interroge sur la propriété intellectuelle, pratiques (Binot et al., 2015). 2. Apports de l’IA et pose un certain nombre de questions pour la compréhension en lien avec un Règlement Général sur la Permettre l’expérimentation des des pathosystèmes Protection des Données (RGPD) adapté technologies IA sur des territoires est à la SA dans le respect de la confiden- un enjeu crucial pour favoriser leur 2.1. Mieux comprendre tialité des données mobilisées. Quel développement, valider leur perfor- l’évolution des pathosystèmes est le modèle économique pertinent mance et mesurer leur qualité prédic- à large échelle au regard de la collecte de données tive (Prospective, 2019). En santé, l’accès ou de l’accès à des bases de données simplifié à des structures génératrices Les méthodes d’apprentissage existantes ? Quid de l’ouverture des de données permettrait d’expérimenter peuvent être utilisées pour réaliser INRAE Productions Animales, 2020, numéro 2
Intelligence artificielle et santé animale / 99 des reconstructions phylogénétiques et al., 2019) ; continent : (Buhnerkempe matique, les constituants du modèle et ainsi proposer des scénarios évo- et al., 2014). Ces modèles dits méca- (hypothèses, ontologie des connais- lutifs, notamment d’agents infectieux nistes permettent d’anticiper les effets sances, structure, paramètres, fonc- et de leurs modes de transmission. de mesures de maîtrise convention- tions, règles…) sont accessibles dans un Ainsi, les modèles phylogénétiques nelles, mais aussi innovantes (nouvelles fichier texte structuré, lisible et révisable offrent une perspective intéressante molécules candidates, capteurs, index par les non-informaticiens, scientifiques pour identifier les lignées bactériennes de sélection génomique ; Ezanno et ou gestionnaires, rendant les modèles environnementales à fort potentiel al., 2015). Cependant, ils requièrent plus transparents. À ce jour, un langage infectieux (Bailly, 2017), ou encore pré- d’intégrer des données et expertises domaine spécifique dédié à l’épidémio- dire les espèces réservoirs et vecteurs multiples en biologie, épidémiologie, logie concerne les modèles à équations arthropodes en jeu (Babayan et al., évolution, écologie, agronomie, éco- différentielles, dits à compartiments 2018). Ensuite, aller vers des modèles nomie, etc. Leur développement pose de type Susceptible-Infecté-Résistant de niches plus phénoménologiques alors des enjeux de fiabilité, de transpa- (SIR) (Bui et al., 2015). Deuxièmement, contribuerait à surveiller les infections rence, de reproductibilité, et de flexibi- l’utilisation d’agents logiciels auto- émergentes et anticiper la diffusion épi- lité d’usage. De plus, ces modèles sont nomes permet de représenter des zootique ou épidémique d’agents infec- souvent développés de novo, mobili- niveaux d’abstraction et d’organisation tieux. Des modèles multi-agents dans sant peu les modèles d’autres pathosys- variés à plusieurs échelles (Mathieu un contexte spatial explicite ont ainsi tèmes. Enfin, ces modèles peuvent être et al., 2018), rendant les modèles plus été développés pour des transmissions considérés comme des boîtes noires par flexibles. Très récemment, un logiciel d’agents pathogènes vectorisés, et sont leurs utilisateurs finaux (gestionnaires générique (EMULSION, figure 2, Picault suffisamment ergonomiques pour être de la santé) alors qu’ils reposent sur et al., 2019b) a été développé, mobili- adaptés à des contextes particuliers des hypothèses biologiques explicites sant à la fois un langage dédié et une (Roche et al., 2008). Enfin, des réseaux mais souvent cachées dans le code ou architecture logicielle à base d’agents. de neurones ont permis d’identifier le les équations. Cette approche double a l’ambition de niveau d’introgression génétique entre répondre le mieux possible aux besoins des populations sauvages et des popu- Bien qu’incontournables, les bonnes récurrents de transparence, fiabilité et lations domestiquées dans un contexte pratiques de programmation (Sandve flexibilité en modélisation des maladies spatialisé (Lek et Guégan, 2000), ce qui et al., 2013) seules ne peuvent répondre transmissibles. Un simulateur interprète aide à comprendre la diffusion de gènes à ces enjeux (Leek et Peng, 2015). les fichiers textes décrivant le système dans les systèmes hôtes × pathogènes L’approche la plus aboutie à ce jour en pour produire le code du modèle, ce à multi-espèces hôtes. Notons ici que épidémiologie requiert encore d’écrire pour tout type de formalismes (modèles plusieurs de ces travaux révèlent le beaucoup de code (O’Hare et al., 2016). à compartiments, individu-centrés) et caractère relativement ancien de cette Des méthodes adaptées manquent d’échelles (individu, population, terri- recherche en IA. Ces recherches ont sou- pour faciliter le développement de ces toire). Des briques de code complémen- vent permis d’identifier des signaux (par modèles, notamment pour représenter taires peuvent être ajoutées pour des exemple la tendance d’introgression des systèmes multi-échelles. Ainsi, les processus spécifiques au pathosystème génétique) voire des patrons ou des processus intra-hôtes sont rarement étudié. La révision des hypothèses du propriétés particulières (par exemple considérés pour prédire la propagation modèle ne nécessite plus de réécrire le l’importance de la densité-dépendance de pathogènes dans des populations, code. Ce type d’approche devrait aussi dans la transmission d’infections par alors que l’hétérogénéité individuelle faciliter la production d’outils d’aide à des insectes vecteurs) moins visibles des hôtes est un facteur crucial de cette la décision destinés aux gestionnaires ou absents dans les traitements statis- propagation (par exemple les interac- et aux décideurs publics de la SA et de tiques plus conventionnels. tions microbiote × pathogène × immu- la sécurité sanitaire plus généralement. nité, Vodovotz et al., 2016). 2.2. Garantir fiabilité, 2.3. Extraire reproductibilité Mobiliser l’IA pour répondre à des connaissances et flexibilité des modèles ces enjeux s’avère prometteur. des données massives épidémiologiques Premièrement, les méthodes de repré- de biologie fondamentale sentation des connaissances per- en santé animale Pour comprendre et prédire la pro- mettent d’expliciter la structure des pagation de pathogènes, il est utile de modèles mécanistes et de réduire le Les méthodes d’apprentissage faci- représenter de manière explicite et inté- code à écrire, accélérant et fiabilisant litent aussi des travaux de biologie fon- grative dans un modèle mathématique leur développement. La séparation damentale, en mobilisant par exemple (équations) ou informatique (simula- entre le développement logiciel et la des analyses morphologiques pour tions) les mécanismes sous-jacents à la représentation des connaissances per- étudier la mobilité cellulaire (Sebag et dynamique du pathosystème, et ce à dif- met à des scientifiques de discipline non al., 2015). L’utilisation d’approches de férentes échelles (intra-hôte : Go et al., informatique de contribuer à concevoir classification et de filtres intelligents 2019 ; filières de production primaire : puis à évaluer les modèles. Au lieu de permet aujourd’hui de trier des don- Ferrer Savall et al., 2016 ; territoire : (Qi n’exister que sous forme de code infor- nées massives de biologie moléculaire INRAE Productions Animales, 2020, numéro 2
100 / Pauline ezanno et al. Figure 2. L’IA au service de la modélisation mécaniste en épidémiologie (Source : blages de prions, permettant ainsi un EMULSION, Picault et al., 2019b). diagnostic plus précoce de ces mala- dies animales de type neurodégénéra- tives, et ouvrant la voie pour identifier des cibles thérapeutiques potentielles (Chyba et al., 2016). En santé humaine, on a assisté dans la seconde moitié du xxe siècle à un développement consé- quent de nouvelles disciplines aux interfaces entre IA et disciplines-phares, notamment la biologie cellulaire et l’im- munologie. Des disciplines d’interface se sont développées, comme la biologie et l’immunologie computationnelles, qui doivent aujourd’hui fertiliser les dif- férents secteurs de la SA. L’immunologie humaine actuelle repose sur la descrip- tion de mécanismes moléculaires et cellulaires fins (par exemple le nombre d’interleukines connues aujourd’hui a augmenté de manière considérable par rapport aux années 1970). La volonté de comprendre les processus sous- jacents aux réponses immunitaires a provoqué une révolution en invitant cette discipline à s’intéresser à la bio- logie des systèmes complexes et aux approches issues de l’IA (Bassaganya- Riera et Hontecillas, 2016). Toutefois, les déséquilibres entre les effectifs d’immunologistes et de modélisateurs en immunologie constituent un frein à l’essor pourtant fantastique de cette nouvelle discipline. 3. Revisiter les méthodes de détection de cas à différentes échelles A. Les modélisateurs développent chaque modèle épidémiologique de novo, et produisent des codes Une gestion rationnelle des troubles spécifiques non lisibles par des scientifiques d’autres disciplines ou par les utilisateurs finaux des de santé en élevage repose sur des prédictions. méthodes performantes de détection B. Mobiliser des approches d’IA pour combiner un langage dédié et une architecture logicielle à base d’agents contribue à rendre les modèles épidémiologiques plus reproductibles, transparents, flexibles, et de cas, que ce soit à l’échelle indivi- transférables aux gestionnaires de la santé sous forme d’outils d’aide à la décision. Un simulateur interprète duelle voire infra-individuelle (organe), les fichiers textes décrivant le système pour produire le code du modèle. Des briques complémentaires du groupe d’animaux, ou de territoires. de code peuvent être ajoutées si nécessaire. Les méthodes d’apprentissage per- mettent de détecter des patrons et (données issues du séquençage massif lome (Tardivel et al., 2017). Par ailleurs, le des signaux dans les grandes masses et de la métagénomique). Des voies de temps de diagnostic est réduit en facili- de données, et en particulier dans les signalisation métabolique, physiolo- tant les analyses d’images (par exemple séries spatiales ou temporelles de cas gique ou immunologique sont explo- la détection accélérée de patrons cli- en santé, et contribuent ainsi à l’essor rées et des métabolites sont identifiés niques, Dórea et al., 2013), souvent d’une agriculture intelligente et de la et quantifiés dans des mélanges biolo- nécessaires pour étudier les interac- télémédecine. Des alertes peuvent être giques complexes. Cet aspect consti- tions hôte-pathogènes en pathologie produites, et contribuer aux conseils tuait jusqu’alors un défi majeur pour animale. Par exemple, l’utilisation de de gestion en agriculture numérique tester a priori des hypothèses liées à la méthodes optimales a permis de mieux (Liakos et al., 2018 ; figure 3) ou dans caractérisation exhaustive du métabo- comprendre la formation des assem- la pratique vétérinaire (Jones-Diette INRAE Productions Animales, 2020, numéro 2
Intelligence artificielle et santé animale / 101 Figure 3. Les données massives en élevage. (Forbes et al., 2013 ; Perez et al., 2009) ou leurs proxies (ex : émergence de Externe Météo maladies infectieuses suite aux pertur- Paysage bations de l’environnement), ou encore Exploitation Bâtiment des symptômes et voies métaboliques Ambiance Données Modèles en cascades précurseurs de patholo- Détention massives prédictifs gies chroniques ou dégénératives. L’IA Commerce permet aussi de mobiliser les informa- Animal Santé tions disponibles sur Internet, par des Performances Alertes méthodes semi-automatiques de fouille Comportement de textes (data mining) pour identifier ! Alimentation et traiter des signaux d’émergence pour Génétique Modèles la veille internationale sur les maladies Éleveur mécanistes animales infectieuses (Arsevska et al., 2018). Outils d’aide Conseillers À large ou très large échelle (terri- au conseil toire, pays, continent…), l’analyse des L’analyse des données massives par des modèles prédictifs (ex : par apprentissage) permet de générer des alertes destinées aux éleveurs. Intégrer de manière automatique ces données ou les alertes produites données de mouvements commerciaux dans des modèles mécanistes permettrait de proposer des outils logiciels d’aide au conseil innovants d’animaux entre élevages (Dutta et al., pour les gestionnaires de la santé, qui soient adaptés aux particularités locales. 2014 ; figure 4) permet de prédire le risque épidémique associé (Hoscheit et al., 2016). Ces mouvements sont dif- et al., 2019). Cela aboutit parfois à une transposition à un autre pathosystème ficilement prévisibles, notamment car détection plus précoce des troubles de ou la prise en compte d’évolutions envi- les échanges commerciaux reposent santé et contribue à la rationalisation ronnementales ou réglementaires est sur de nombreux facteurs associés des traitements anti-infectieux (notam- hasardeuse. Par ailleurs, si les méthodes aux activités et décisions humaines. ment antibiotiques) chez les animaux d’apprentissage (classification, analyse Des méthodes de reconnaissance de production. Cela peut reposer sur d’images, reconnaissance de formes, de patrons spatio-temporels et des l’analyse de données collectées à par- fouille de données…) apportent des développements méthodologiques tir d’objets connectés (Morota et al., solutions pour un large panel de pour l’analyse de graphes relationnels 2018), le typage de la santé individuelle questions de recherche en bioméde- dynamiques orientés et pondérés sont ou de groupe (Dórea et al., 2013), voire cine et biosanté, il est crucial de bien requis dans ce domaine car très peu des des modèles mécanistes prédictifs de démontrer par des méthodes de vali- méthodes permettent à ce jour d’étu- l’occurrence des détections de nou- dation éprouvées la performance de dier des systèmes à grande échelle alors veaux cas à traiter (Picault et al., 2019a). ces méthodes en mesurant leur qualité que les jeux de données sont souvent Ensuite, une optimisation multicritère prédictive et en les comparant lorsque de très grande taille (plusieurs dizaines permet de raisonner les stratégies thé- c’est possible aux méthodes statistiques voire centaines de milliers d’exploita- rapeutiques en identifiant qui traiter alternatives. tions en interaction dynamique). dans un groupe, quand, selon quel protocole et pendant quelle durée, de À l’échelle des populations, la détec- manière à maximiser la probabilité de tion de cas repose sur une surveillance 4. Cibler les interventions, guérison tout en minimisant le risque directe (détection des troubles) ou intégrer l’humain de résistance et les doses utilisées indirecte, mobilisant des informations au système et soutenir (médecine individualisée et médecine connexes (proxies) à l’occurrence des ses décisions de précision). troubles. Ainsi, l’émergence de certaines maladies est détectée par une surveil- Néanmoins, la qualité des alertes lance syndromique, en détectant des 4.1. Choisir parmi reste assujettie à la qualité et à la signaux anormaux dans des données toutes les alternatives représentativité des jeux de données collectées en routine (mortalité, repro- Un enjeu des gestionnaires de la santé utilisés par les algorithmes d’appren- duction, comportement, production lai- est d’identifier les combinaisons de tissage. De nombreux biais (d’origine tière, utilisation médicamenteuse plus mesures de maîtrise les plus pertinentes matérielle, logicielle, humaine) peuvent importante… ; Marceau et al., 2014). selon les spécificités locales (caractéris- entacher le bien-fondé des prédictions. Ici les méthodes d’IA et les statistiques tiques des élevages, objectifs de pro- De plus, des alertes produites après un sont fortement complémentaires, duction…) et territoriales (ressources apprentissage reflètent nécessaire- devant s’appuyer sur un large panel de collectives disponibles, localisation ment les spécificités du système dont données, fortement hétérogènes, par- des élevages, priorités de gestion…), les données sont issues (lieu, période, fois massives et souvent éparses, pour pour anticiper les effets de change- pratiques d’élevage…), de sorte qu’une détecter des signaux souvent faibles ments sanitaires, environnementaux INRAE Productions Animales, 2020, numéro 2
102 / Pauline ezanno et al. Figure 4. Mouvements commerciaux de bovins en France en 2009 (Source : Base 4.2. Tenir compte de données nationale d’identification des bovins – BDNI). des attentes et des peurs des gestionnaires de la santé Les gestionnaires de la santé ani- male doivent disposer des prédictions issues de modèles dans un temps com- patible avec les besoins de gestion. Face à des émergences imprévisibles (nouveaux pathosystèmes, nouvelles conditions de circulation, mesures de maîtrise à déterminer…), cela peut s’avérer problématique. Envisager une bibliothèque de modèles ayant un cadre commun renforcerait la réacti- vité des épidémiologistes, permettant de développer des modèles pertinents plus rapidement et de les mettre à jour avec des données actualisées (« real- time system modeling ») lors de la pro- gression des épidémies. Néanmoins, si cela accélèrerait le passage du modèle conceptuel (dérivé des connaissances et des hypothèses biologiques sous- jacentes) à l’outil d’aide à la décision, un gain de réactivité serait encore obtenu par la génération automatique de code Ces mouvements forment un réseau dynamique, orienté et pondéré. Le prédire est un challenge scientifique et technique, pour lequel de nouvelles méthodes sont requises et auquel l’IA pourrait informatique performant et l’adapta- contribuer. tion de code en autonomie ; ce qui reste à ce jour un verrou méthodologique important à lever en IA. Par ailleurs, il est et réglementaires, et promouvoir des in silico d’évaluer, comparer, hiérarchiser souvent nécessaire de réaliser un très conseils sanitaires de qualité. La ques- un large panel d’options à moindre grand nombre de calculs ou d’analyser tion se pose aussi de comment favoriser coût (figure 5 ; Beaunée et al., 2017). de très grandes bases de données, ce l’innovation en SA, par exemple anti- Cependant, la plupart des modèles qui appelle à une utilisation raisonnée ciper les caractéristiques requises de disponibles n’intègre pas explicitement des ressources informatiques. Ainsi, les molécules candidates (Schneider, 2019), l’humain et sa décision, alors que les outils logiciels transférés vers les ges- ou évaluer l’avantage concurrentiel de décisions de maîtrise sont souvent de tionnaires requièrent parfois l’usage stratégies innovantes (sélection géno- l’initiative des éleveurs (ex : maladies de ressources privées de type cloud mique d’animaux résistants, nouveaux non réglementées), avec des consé- (logiciels qui ne fonctionnent pas sur vaccins…) par rapport aux stratégies quences sanitaires et décisionnelles de simples ordinateurs), mettant en conventionnelles. Les gestionnaires parfois à large échelle (diffusion infec- exergue le compromis entre coût de privés (éleveurs, conseillers des éle- tieuse, diffusion de l’information et simulation, continuité de service (par veurs) et collectifs (groupements d’éle- des rumeurs, zone d’influence…). Des exemple la gestion des pannes) et veurs, pouvoirs publics…) ont besoin travaux récents visent à intégrer l’hu- temps requis pour obtenir les résultats d’outils d’aide à la décision (OAD) pour main et ses décisions dans le système de simulations (Pham et al., 2017). Ces cibler les incitations publiques, iden- en mobilisant du contrôle optimal et questions relèvent pour l’heure de la tifier les investissements à privilégier des stratégies adaptatives issues de recherche en informatique, et des col- par l’éleveur (Ezanno et al., 2018) et l’IA (Viet et al., 2018) ou encore des laborations sont souhaitables entre ces cibler au mieux les mesures : qui cibler méthodes d’économie de la santé (Tago chercheurs et ceux de SA. (quels élevages, quels animaux) ? avec et al., 2016 ; Krebs et al., 2018). Ces tra- quelle(s) mesure(s) ? quand et pendant vaux sont précurseurs en SA et doivent Les gestionnaires souhaitent aussi combien de temps ? etc. Ces questions être poursuivis et étendus dans le cadre s’appuyer sur des prédictions précises deviennent incontournables pour rai- du développement de l’agroécologie, provenant de représentations réalistes sonner l’usage des intrants (antibio- de la demande sociétale actuelle en des systèmes biologiques. Avant d’être tiques, pesticides, biocides…). matière de qualité des produits et de utilisés, le comportement des modèles respect des écosystèmes et de leur doit être analysé. Se posent alors les Le recours à la modélisation méca- biodiversité, et plus généralement de questions d’exploration dans l’espace niste est une solution qui permet la sécurité sanitaire internationale. des incertitudes et des données, et INRAE Productions Animales, 2020, numéro 2
Intelligence artificielle et santé animale / 103 Figure 5. Identifier les stratégies pertinentes pour maîtriser la paratuberculose demain, pour quels objectifs ? Dans bovine à l’échelle régionale (d’après Beaunée et al., 2017). un esprit de surveillance contrôlée, ces OAD ne risquent-ils pas d’entraî- ner une dérive de discrimination des élevages selon leur statut sanitaire, même lorsque ce statut sanitaire ne peut être géré par les seules interven- tions de l’éleveur ? Les nouvelles tech- nologies issues de l’IA peuvent en effet revêtir un caractère double, offrant par exemple la possibilité d’un contrôle des cheptels par des groupes interna- tionaux de l’agro-alimentaire parfois propriétaires des données collectées. Deuxièmement, il existe aussi en SA une crainte de voir l’outil remplacer l’expertise humaine. Pourtant, auto- matiser ne signifie en rien remplacer l’humain, son expertise et sa décision (Reddy et al., 2019). Il s’agit plutôt de Classiquement, identifier les stratégies pertinentes revient à les définir a priori puis à les comparer, par renforcer ses capacités d’abstraction exemple par modélisation. Généralement, seul un faible nombre d’alternatives est considéré. Ici, toutes et d’analyse, accélérer le processus les alternatives sont considérées, aboutissant à une multitude de scénarios dont l’analyse peut devenir un challenge. Chaque point correspond à la situation épidémiologique après 9 ans de propagation du global, fiabiliser les prédictions, gui- pathogène sur un réseau de 12 500 troupeaux bovins laitiers pour une stratégie donnée (astérisque : der les recherches complémentaires. pas de maîtrise). Initialement, 10 % des animaux sont infectés en moyenne dans 30 % des troupeaux. Néanmoins, un développement impor- Les points les plus bleus correspondent aux stratégies les plus favorables. Mobiliser dans un tel cadre tant des ressources et matériels infor- des approches d’IA, notamment d’optimisation sous contraintes, faciliterait l’identification des stratégies matiques n’est pas sans impacts sur pertinentes en explorant l’espace des possibles de manière plus ciblée. l’environnement en termes de bilan carbone (serveurs énergivores, recy- d’optimisation sous contraintes. Cela ii) inférer des processus et des proprié- clage des capteurs…), ce qu’il faut requiert souvent des simulations tés émergentes. Des développements aussi prendre en compte dans le cadre intensives, qui bénéficieraient d’algo- méthodologiques sont encore requis du développement de l’agroécologie. rithmes d’optimisation pour parcourir et qui bénéficieraient à de nombreuses Troisièmement, la très grande com- plus efficacement l’espace des pos- problématiques de santé, notamment plexité d’analyse et d’acculturation sibles. En retour, cela permettrait par en lien avec les notions actuellement des résultats et connaissances issus exemple d’identifier automatiquement en pleine évolution de réservoir-hôte, de la recherche académique, notam- comment atteindre un objectif fixé d’hôte relais (« edge-host »), et de bar- ment de l’IA, constitue un obstacle à (ex : réduction de la prévalence d’une rière d’espèces (Han et al., 2019). Les l’appropriation des OAD par leurs utili- maladie sous un seuil acceptable) tout développements méthodologiques sateurs et peut conduire à préférer des en tenant compte des ressources dis- et la diffusion des méthodes exis- méthodes plus simples et faciles d’ac- ponibles. Si cette question trouve des tantes sont à poursuivre (par exemple cès. Toutefois, ces dernières peuvent solutions en statistique moderne pour le réseau français pluri-organismes se révéler ne pas toujours être les plus des systèmes relativement simples, elle Mexico : « Méthodes pour l’EXploration pertinentes ou les plus fiables. Des pro- représente un front de science pour les Informatique des modèles Complexes » jets de science participative (« citizen systèmes complexes (large échelle, mul- organise des écoles-chercheurs sur science »), aussi nommée participa- ti-hôtes, multi-pathogènes, multi-sys- « Analyse de sensibilité, métamodéli- tion communautaire en épidémiolo- tèmes…) qui deviennent la norme. sation et optimisation de modèles », gie humaine (« community health »), De plus, des objectifs d’optimisation https://reseau-mexico.fr/). permettront en SA de co-concevoir et spécifiques à la SA peuvent engen- co-construire les OAD de demain avec drer des besoins méthodologiques Enfin, trois limites ont été identi- leurs utilisateurs. Cet effet d’entraîne- ad hoc (Shah et al., 2019). Les besoins fiées quant au développement d’OAD ment permettra de mieux répondre en capacité d’abstraction et d’analyse pour les gestionnaires de la santé, liés aux attentes et aux besoins des uti- sont massifs et pourraient bénéficier à l’acceptabilité de l’IA au sens large lisateurs mais aussi des citoyens, de des complémentarités entre IA (explo- comme facteur majeur de progrès rendre moins opaques les systèmes et ration raisonnée, utilisation intelligente (Prospective, 2019). Premièrement, les les approches informatiques, et d’ac- des ressources informatiques, calculs questions d’éthique, flagrantes lors- croître leur confiance dans les prédic- optimisés…) et statistiques pour tirer qu’il s’agit de santé humaine, sont aussi tions de modèles académiques parfois autant d’information que possible des importantes à prendre en compte en obscurs, notamment lorsqu’ils ne sont données : i) explorer, analyser, prédire ; SA. Quels OAD souhaitons-nous pour pas lisibles (lignes de code sans filtre). INRAE Productions Animales, 2020, numéro 2
Vous pouvez aussi lire