PROFIL DE LA MAIN D'ŒUVRE - EN INTELLIGENCE ARTIFICIELLE, SCIENCE DES DONNÉES ET MÉGADONNÉES AU QUÉBEC - TECHNOCompétences
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
PROFIL DE LA MAIN D’ŒUVRE EN INTELLIGENCE ARTIFICIELLE, SCIENCE DES DONNÉES ET MÉGADONNÉES AU QUÉBEC En partenariat avec 1
Éditeur TECHNOCompétences, le Comité sectoriel de main-d’œuvre en technologies de l’information Pour citer ce rapport : et des communications, Mélanie Bosc, directrice générale. Cayrat, C., Sigouin-Lebel, A., & Poirier St-Pierre, G. (2021). Profil de la main-d’œuvre en intelligence artificielle, science des données et mégadonnées au Québec. TECHNOCompétences, Montréal, 113 p. Direction de l’étude Comité de pilotage Aubert Sigouin-Lebel, Chargé de la recherche, TECHNOCompétences Brian Moore, Institut de valorisation des données (IVADO) Ayant fait l’objet d’une approbation par le comité scientifique, cette étude sera présentée à l’occasion Analyse et rédaction du 88e Congrès de l’ACFAS (Association Francophone pour le Savoir) en mai 2021 Charles Cayrat, Chercheur doctoral, Émélie Brunet, Université d’Auckland Institut Québécois d’Intelligence Artificielle (Mila) Cayrat, Charles. (2021). Le profil de main-d’œuvre en intelligence artificielle, science des données et Aubert Sigouin-Lebel, Chargé de la recherche, Aurélie Sénéchal-Parfait, mégadonnées au Québec : proposition d’une taxonomie des métiers et des compétences. TECHNOCompétences Centre de recherche informatique de Montréal (CRIM) Communication présentée au 88e Congrès de l’ACFAS, Montréal. Analyse support Réjean Roy, Forum IA Québec Guillaume Poirier St-Pierre, Conseiller Principal, Optimum Talent Benoît Pagé, Pôle montréalais d’enseignement Cette étude a été réalisée grâce à l’aide financière du Conseil Emploi Métropole (CEM) Conception graphique supérieur en intelligence artificielle (PIA) Émilie Jobin, Graphiste Tim Fournier, Conseil Emploi Métropole (CEM) Révision Clotilde Morin, Rédactrice Charles Rémillard, Finance Montréal Traduction et francisation Florian Saugues, Numana Caroline Dallaire, Versacom Ugo Ceppi, Direction de l’analyse et de l’information sur le marché du travail (DAIMT) 550 rue Sherbrooke Ouest – Tour Ouest, bureau 350, Montréal (Québec), H3A 1B9 Nancy Barbeau, Ministère de l’Enseignement supérieur Téléphone : 514-840-1237 info@technocompetences.qc.ca · www.technocompetences.qc.ca Anne-Louise Brassard, Ministère de l’Enseignement supérieur Jesus Jimenez-Orte, Ministère de l’Éducation © TECHNOCompétences, 2021 Claire Adam, Ministère de l’Économie ISNB 978-2-925166-00-9 Dépôt légal – Bibliothèque nationale du Québec, 2021 2 3
TABLE DES MATIÈRES Éditeur 2 4 PORTRAIT GLOBAL DE L’EMPLOI 38 Mot de la direction 7 Introduction 8 5 TAXONOMIE DES MÉTIERS DE L’INTELLIGENCE NUMÉRIQUE 44 Éléments traités dans l’étude 8 Méthodologie 8 Taxonomie 46 Schéma méthodologique 9 Note méthodologique 47 Fiches métiers 48 Visualisation des sources de données 48 1 CONTEXTE 10 Répartition industrielle de la taxonomie des métiers de l’intelligence numérique 68 Portrait d’un écosystème en IA de premier rang mondial 12 Une adoption encore timide 12 6 ÉTAT DE LA DEMANDE DE COMPÉTENCES 70 La genèse de l’IA à Montréal et au Québec 13 L’arrivée de géants technologiques au Québec 13 Note méthodologique 72 Constitution d’un écosystème québécois en IA 14 Intelligence numérique : les besoins en main-d’œuvre 72 Développer le bassin de talents en IA : Une priorité absolue 16 Le processus d’embauche en intelligence numérique 73 Investissements publics majeurs 17 Les facteurs déterminant l’embauche en intelligence numérique 74 Les besoins en main-d’œuvre à court terme 79 Les besoins futurs en main-d’œuvre 81 2 DÉFINITION DU DOMAINE DE L’INTELLIGENCE NUMÉRIQUE 18 État de la formation 82 Note méthodologique 20 Les éléments distinctifs de la formation en intelligence numérique au Québec 82 Définition de l’IA 20 Les universités et instituts de recherche québécois qui se démarquent 83 Une technologie habilitante 21 Les principales forces des talents sortant de ces programmes 83 Quatre éléments fondamentaux 21 Les principales lacunes des programmes proposés 84 Les types d’apprentissage 22 Le programme de formation idéal en intelligence numérique 85 Les utilisations de l’IA 23 Les stages et la formation en entreprise 86 Un besoin massif de données 23 Vers une IA explicative 23 7 CONCLUSION ET AVENUES DE RECHERCHE FUTURES 88 Définition des mégadonnées 24 Les « V » des mégadonnées 25 Le traitement distribué des données 25 8 ANNEXES 92 Les services en infonuagique 26 Visualisation des réponses du sondage auprès de professionnels 94 Définition de la science des données 29 en intelligence numérique Les principaux éléments de la science des données 29 Matrice Emploi/Outils numériques et technologies 104 Liste des figures 112 3 LE PROCESSUS DE CRÉATION ET D’INTÉGRATION DE L’IA 32 Bibliographie 113 L’identification des problématiques et l’orientation stratégique 34 La preuve de concept 35 La production 36 L’adoption 37 4 5
MOT DE LA DIRECTION Ces dernières années, le Québec a connu une efferves- 5 Des fiches métiers traitant de l’estimation du cence remarquable concernant l’intelligence artificielle bassin de talents et incluant de multiples informa- (IA), notamment grâce à l’excellence en recherche acadé- tions spécifiques (salaires, tâches principales, référen- mique dans ce domaine qui a entraîné l’arrivée de géants tiel de compétences techniques et transversales) ; de la technologie, la création d’entreprises québécoises en démarrage et la mise sur pied d’instituts de recherche 6 Une répartition industrielle des métiers de l’intelli- de renom. De multiples efforts ont été déployés afin de gence numérique propulser l’essor d’un écosystème riche et stimulant en intelligence artificielle, envié mondialement. Mais restait 7 Un portrait de la demande de compétences et de un élément fondamental à examiner plus en profondeur : la formation, incluant les forces et défis concer- la main-d’œuvre. nant ce profil de talents qui change à une vitesse déstabilisante. Il était donc important pour TECHNOCompétences de saisir cette opportunité à travers la réalisation d’un profil 8 L’ensemble de nos données sur l’utilisation des outils de la main-d’œuvre en intelligence artificielle, science des numériques, sous la forme de matrices Emploi/Outils données et mégadonnées au Québec proposé aujourd’hui. numériques et technologies, en annexe du document. TECHNOCompétences déploie toute son énergie à Un peu partout, nous y avons ajouté des faits explicatifs soutenir les entreprises du secteur et le développement ainsi que des informations basées sur les données que nous des compétences numériques, que ce soit par la produc- avons recueillies. tion d’études, d’outils de gestion des ressources humaines ou encore par le partage d’expertises. Le présent profil est Nous tenons à remercier la contribution de nos partenaires un exemple de contribution du Comité sectoriel. dans ce projet. En premier lieu, le Conseil emploi métropole pour sa contribution financière à la réalisation du projet. Dans ce profil, vous trouverez : Nous remercions également les membres du comité de pilotage qui, de par leurs commentaires et rétroactions, se 1 Une revue historique de la position du Québec en sont engagés à faire de ce profil une réussite. matière d’intelligence artificielle ; Bonne lecture ! 2 Une définition de la main-d’œuvre du secteur ; Mélanie Bosc 3 Un portrait global de l’emploi ; Directrice générale 4 Une taxonomie des métiers de l’intelligence numérique – que nous définissons comme étant la main-d’œuvre spécialisée en intelligence artificielle ainsi que les métiers périphériques essentiels reliés ; 6 7
INTRODUCTION Éléments traités dans l’étude Schéma méthodologique L’avènement de l’intelligence artificielle (IA), la science En évolution constante et sujettes à de multiples interpré- Note des données et les mégadonnées (big data) entraîne tations, nous présentons en premier lieu les définitions des Instruments de collecte et Sections traitées méthodologique des changements technologiques et socioéconomiques concepts d’intelligence artificielle, de science des données sources de données correspondante majeurs dont les impacts sur les organisations demeurent et de mégadonnées tels que perçus par les professionnels opaques. Afin de mieux comprendre l’ampleur de ces de l’industrie au Québec. Les résultats de recherche font changements sur les entreprises, la présente étude vise à également état du processus de création et d’intégration I Contexte Revue de littérature professionnelle - proposer le premier profil de la main-d’œuvre en intelli- de l’IA dans l’entreprise, présentent une estimation du gence numérique au Québec. nombre de professionnels travaillant dans les domaines de l’intelligence numérique et offrent une première taxonomie II Définition du domaine de Entrevues individuelles semi-structurées Page 20 Celle-ci repose sur la combinaison de méthodes de des métiers distinguant les professionnels techniques des l’Intelligence Numérique auprès d’experts de l’industrie recherche qualitative et quantitative comprenant une professionnels d’interface. Enfin, nous proposons une de l’IA au Québec série d’entrevues semi-structurées auprès d’experts de l’in- III Le processus de création et cartographie des profils de compétences de ces métiers dustrie de l'IA au Québec, deux sondages auprès de pro- d’intégration de l’IA émergents et présentons les besoins et programmes de fessionnels en IA (n=75) et TIC (n=400), ainsi que l’analyse formation correspondants. thématique de 13 500 offres d’emplois en ligne. IV Portait global de l’emploi Base de données Gartner répertoriant 13 500 annonces d’emplois en ligne V Taxonomie des métiers de l’Intelligence Numérique Entrevues individuelles semi-structurées auprès Page 47 MOTS-CLÉS : (19 fiches-métiers) d’experts de l’industrie de l’IA au Québec VI 19 Fiches métier de Sondage (n=75) réalisé auprès de l’intelligence numérique professionnels occupant un emploi relié à l’IA, aux mégadonnées ou à la INTELLIGENCE NUMÉRIQUE Profil main-d’œuvre VII Répartition industrielle science des données au Québec. des métiers de l’intelligence Intelligence Artificielle MÉGADONNÉES numérique BIG DATA SCIENCE DES DONNÉES Emplois COMPÉTENCES Formation QUÉBEC VIII État de la demande Communauté en ligne composée d’experts Page 72 de compétences en intelligence numérique au Québec. Entrevues téléphoniques de suivi. IX État de la formation Sondage (n=400) réalisé auprès de professionnels évoluant dans une entreprise du secteur des TI au Québec Méthodologie La présente étude repose sur la combinaison de méthodes Toutes les données primaires utilisées et restituées dans de recherche qualitative et quantitative permettant la le présent rapport ont été collectées en respectant les X Matrices Emploi/Outils Base de données Gartner répertoriant - collecte et l’analyse de données primaires et secondaires. principes éthiques généralement établis en recherche uni- numérique 13 500 annonces d’emplois en ligne Les données sont en provenance de sources publiques et versitaire. Ceux-ci garantissent confidentialité et anonymat privées. à l’ensemble des participants. Chacun d'entre eux a accepté les conditions de la recherche par la signature d’un formu- laire de consentement prévu à cet effet. 8 9
1 CONTEXTE
Portrait d’un écosystème en IA La genèse de l’IA à Montréal et au Québec de premier rang mondial Les métiers de l’intelligence numérique1 au Québec sont son avant-gardisme dans la recherche fondamen- Créés respectivement en 1985 et 1990, le Centre for l’intérêt pour l’apprentissage profond est marquée d’un en effervescence. Ils participent à une tendance mondiale tale et appliquée en IA, la présence de pôles novateurs Intelligent Machines et le Reasoning and Learning Lab de côté par la publication d’articles novateurs et de l’autre par à la promotion du développement des infrastructures d’hébergement, de protection et de valorisation des l’Université McGill se spécialisent alors dans les systèmes l’applicabilité croissante de cette technologie grâce aux de données et des talents en intelligence numérique. données, ainsi que son bassin d’experts, chercheurs et probabilistes, le traitement de langage naturel, l’apprentis- nouvelles capacités de calcul et de stockage des données. Les avancées technologiques progressent à un rythme étudiants en IA, parmi les plus importants au monde. sage par renforcement et l’application de l’IA en robotique. Dès lors, le talent en apprentissage profond devient une soutenu à travers la planète : elles poussent les nations à Durant cette même période nait le centre de recherche spécificité très recherchée par les grandes entreprises repenser leurs modèles socioéconomiques et à promou- en informatique de Montréal (CRIM), qui développe dès technologiques. voir le développement des infrastructures de données ses premières années des outils de reconnaissance de la et d’intelligence artificielle (IA). Les dépenses mondiales Une adoption encore timide parole. reliées aux systèmes d’IA devraient d’ailleurs atteindre 110 milliards de dollars US d’ici à 2024, soit une croissance de En 1993, c’est l’Institut québécois d’intelligence artificielle 100 % (IDC, 2020). La concurrence est féroce et ce qui en Si l’IA présente des potentiels de gains en productivité (Mila) qui voit le jour grâce au professeur Yoshua Bengio de l’Université de Montréal. Reconnu mondialement pour est une bibliothèque découle est lourd de conséquences. Le leadership en IA évidents, son intégration dans les organisations demeure ses importantes contributions au domaine de l’apprentis- Python pour l’apprentissage automatique créée et et en gestion des données est donc devenu crucial dans complexe, considérant son impact sur l’évolution des maintenue initialement par Mila, et ce, dès 2007. un contexte où les pays les plus avancés sont ceux qui processus organisationnels, des modèles d’affaires et les sage profond, Mila se distingue dans la modélisation du Theano témoigne du caractère précurseur de certains en tireront le maximum d’avantages économiques. Car changements stratégiques et culturels qui en découlent. En langage, la traduction automatique neuronale, la recon- chercheurs basés à Montréal. comme l’a démontré l’implantation de certaines techno- effet, les résultats d’un récent sondage mené par Deloitte naissance d’objets et les modèles génératifs. La hausse de logies par le passé (comme la 4G), les pionniers sont aussi (2019) auprès de citoyens canadiens et d’entreprises inter- ceux qui fixent les règles du jeu et qui assurent leur com- nationales identifie le manque de connaissances en IA, le pétitivité dans un futur plus que jamais numérique. Dans manque de confiance dans les décisions prises par l’IA, la ce contexte et par des stratégies innovantes (CIFAR, 2019, difficulté à collaborer avec les fournisseurs et à démontrer Forum IA Québec, 2018), le Québec s’est doté d’un plan la valeur générée par l’IA ainsi que les problématiques d’in- ambitieux pour figurer parmi les leaders mondiaux en tégration et de mise en œuvre de l’IA comme principaux intelligence numérique. obstacles à l’adoption de cette technologie par les entre- L’arrivée de géants technologiques au Québec prises canadiennes. De plus, seuls 31 % des entreprises Le Québec ne part pas de zéro concernant la promotion ayant adopté l’IA qualifient leur déploiement de réussite Attirées par l’essor de Mila et l’effervescence de l’écosys- industriel qu’universitaire, et complémente les initiatives de l’industrie et des talents en intelligence numérique. (Reynolds, 2018). Force est d’admettre que l’adoption de tème québécois, plusieurs entreprises multinationales ont gouvernementales avec le déploiement d’investissements Fleuron de l’économie numérique canadienne, le Québec l’IA est à la fois une opportunité et un défi. fait le choix de s’établir à Montréal. L’arrivée de ces entre- massifs (plus de 700 M$ depuis 2016). est reconnu à l’échelle internationale pour l’excellence prises technologiques dynamise le milieu, tant sur le plan de son écosystème en intelligence artificielle. Montréal Un retour sur le positionnement historique de Montréal abrite aujourd’hui l’un des écosystèmes en IA les plus et du Québec en matière d’IA permet de mieux com- dynamiques au monde où acteurs industriels et acadé- prendre les enjeux concernant cette technologie et sa Figure 2 : Arrivée d’entreprises internationales à Montréal (Investissement Québec, 2019) miques travaillent de concert. Parmi ses forces, notons main-d’œuvre. NOV. 2016 APRIL 2017 OCT. 2017 JAN. 2018 MAY 2018 SEPT. 2018 JAN 2019 Figure 1 : Le niveau d’intégration des méthodes de machine learning (ML) des entreprises embauchant un professionnel en intelligence numérique Oui, nous utilisons des méthodes de ML pour générer des informations 21 % 28 % Aucune intégration Oui, nous explorons les méthodes de ML 16 % 9% Je ne sais pas 12 % 13 % Oui, nous avons récemment Oui, nous avons des commencé à utiliser JAN. 2017 SEPT. 2017 OCT. 2017 MARCH 2018 JUNE 2018 OCT. 2018 méthodes de ML bien établies des méthodes de ML 1 L’intelligence numérique regroupe les emplois techniques en IA, science des données et mégadonnées ainsi que les emplois périphériques opérant dans « l’interface » de l’entreprise. 12 13
Ces géants technologiques du secteur privé, principa- En 2016 nait l’Institut de valorisation des données (IVADO). lement américains, exercent toutefois une pression sur À l’intersection entre les mondes universitaires et corpora- le marché des talents en attirant un nombre significa- tifs, IVADO démontre l’excellence des travaux québécois en tif d’experts en IA2. Les producteurs d’IA jouent donc un intelligence numérique avec des projets pluridisciplinaires rôle majeur dans la stimulation de la demande en IA au et intersectoriels. En misant sur le transfert technologique, Figure 3 : Forces et faiblesses des acteurs de l’écosystème québécois en IA (Forum IA Québec, 2018, p. 13) sein de l’écosystème québécois. Ceci creuse toutefois le les instituts comme IVADO, le CRIM, l’Institut Intelligence fossé entre ces producteurs d’IA, leaders dans le secteur et Données (IID) de l’Université Laval ou encore des centres FORMATION ET RECHERCHE TISSU INDUSTRIEL ÉCOSYSTÈME DE SOUTIEN privé, et les petites et grandes entreprises québécoises collégiaux de transfert de technologies en intelligence arti- consommatrices d’IA qui peinent à amorcer leur virage ficielle comme JACOBB constituent une réelle source de Expertise de pointe au-delà de McGill et Récentes levées de fonds de startups Maturité du capital risque et appétit numérique. Au-delà des investissements commerciaux création de valeur pour l’écosystème en IA. UdeM prometteuses en IA, avec un total de d’investir dans l’IA. ~ 150 M$ au cours des 2 dernières années colossaux, ces multinationales jouent également un rôle Présence de forces sectorielles propres à Présence d’un vaste réseau provincial majeur en recherche. Le Canada compte à cet effet plus En 2018 est lancée Scale AI, une supergrappe d’innovation chaque université, sur lesquelles bâtir et Grande effervescence à Montréal créée d’acteurs historiques du transfert de 70 grandes entreprises ayant leur propre laboratoire de fédérale en IA visant à développer les chaines d’approvi- créer un potentiel de spécialisation par l’établissement de 7 centres de technologique vers les PME, p. ex., recherche par des géants technologiques Transtech, CEFRIO et le CRIM recherche en IA (Gagné, 2019). sionnement de nouvelle génération par l’intégration de Mouvement d’augmentation de la l’IA afin d’accroître la performance des entreprises cana- quantité et qualité de talent embauchés Présence de plusieurs acteurs à par les universités; p. ex., à l’ÉTS et l’avant-garde des déploiements de diennes. Considérée comme un acteur central de l’éco- Polytechnique, 2 fois plus d’étudiants transformations analytiques et numériques système canadien en IA, Scale AI prévoit de générer un en TI en 5 ans en grandes entreprises, p. ex., Accenture, McKinsey, Deloitte impact de plus de 16,5 milliards $ CA sur le PIB canadien Proactivité des acteurs académiques, et la création/amélioration de plus de 16 000 emplois. De p. ex., révision en cours de programmes Constitution d’un écosystème plus, le ministère du Travail, de l’Emploi et de la Solidarité connexes à l’IA québécois en IA sociale a octroyé en juillet 2019 une aide de 23,4 millions $ CA à l’organisation pour appuyer des activités de formation pour plus de 25 000 professionnels, cadres et dirigeants. Malgré une collaboration existante, Écosystèmes de grappes bien Les institutions académiques se sont dotées Plusieurs organisations endossent un rôle central dans opportunité d’améliorer davantage connectées, mais dont le rôle vis-à-vis de structures visant à accélérer le transfert la coordination entre universités et de la grappe en IA reste à définir sur technologique, bien que le format ait l’exécution de la stratégie provinciale en IA et en gestion S’inscrivant dans le cadre du Partenariat mondial sur l'in- avec les acteurs industriels une base individuelle besoin d’être précisé des mégadonnées. La Stratégie pour l’essor de l’écosys- telligence artificielle (PMIA), le Centre international tème québécois en intelligence artificielle (Forum IA de Montréal pour l'avancement de l'intelligence artifi- Québec, 2018) a comme objectif d’unir ces acteurs avec cielle (CEIMIA) est créé en juin 2020. Piloté par Montréal Difficultés pour attirer le talent À l’exception des principales entreprises Force de frappe qui demeure limitée en l’ambition de « créer au Québec le plus important éco- International, il vise à renforcer l’innovation, la commercia- académique, dues aux ressources technologiques, difficulté croissante à transfert technologique auprès des PME système d’intelligence artificielle en Amérique du Nord financières et au cadre d'emploi embaucher des talents en TI lisation et l’utilisation responsable de l’IA et des données. Capacité de transfert technologique et développer une force de travail en ce domaine pour La participation aux activités du PMIA favorise également Fort risque de perdre l’avantage compétitif Niveau naissant d’intérêt dans les grandes répartie à travers de multiples acteurs - historique - petit bassin de talents entreprises « non tech » québécoises, p. ex., Aligo, Univalor, avec des liens plus enraciner ce créneau et hisser le Québec au rang des la collaboration entre les gouvernements des provinces et facilement déstabilisable - , crainte mais manque de compréhension sur le ou moins proches des universités principaux concepteurs, utilisateurs et exportateurs de du fédéral, tout en développant des partenariats interna- de l’écosystème face aux géants potentiel de valeur à court terme et de technologiques transformation des modèles d’affaires à Manque de financement de croissance solutions d’intelligence artificielle ». tionaux (tels que le partenariat stratégique entre le Québec pour les futures startups à succès plus long terme et la France dans le cadre de la Déclaration franco-cana- Absence d’arrimage entre la formation Considéré comme un acteur indispensable de la stratégie, dienne sur l’intelligence artificielle). universitaire, la formation collégiale et les Rareté d'entreprises/organisations besoins de l’industrie d’ancrage pouvant servir de premier client Mila joue un rôle essentiel dans l’écosystème québécois. En effet, cet institut compte aujourd’hui la plus importante Dans cette lignée, le Forum IA Québec a officiellement lancé Multiplication des acteurs et des alliances Capital de croissance insuffisant à l’intérieur et à l’extérieur du Québec concentration de chercheurs spécialisés en apprentissage ses activités en septembre 2020 avec comme objectif de automatique au monde (plus de 600, incluant les profes- rassembler les acteurs gouvernementaux et non gouver- seurs), et comporte également 36 chaires de recherche en nementaux de l’écosystème québécois en IA, et de pro- IA sur les 80 du pays. Regroupé dans un nouvel espace de mouvoir leur collaboration. Au-delà de ses activités de 90 000 pi2 dans le Mile-Ex, Mila a pour vocation d’être plus vigie locale et de réflexion stratégique, le Forum favorise qu’un centre de recherche et de servir de centre de gravité également le rayonnement de l’écosystème québécois au pour les entreprises en démarrage, les investisseurs et les Canada et à l’international. laboratoires d’entreprises. 2 46 % selon le Global AI Talent Report de Jean-François Gagné (2019) 14 15
Développer le bassin de talents en IA : Une priorité absolue La présence de grands groupes technologiques dessine un écosystème québécois complet capable aujourd’hui de De plus, les différents cégeps et universités de Montréal ont suivi l’une des recommandations mentionnées plus haut en rivaliser avec celui de la Silicon Valley, principal responsable de la fuite des cerveaux canadiens. Toutefois, cette opportu- créant un lieu de concertation et de collaboration sous la forme d’un pôle montréalais en enseignement supérieur (PIA). nité accentue la rareté des talents en IA et les difficultés liées à leur rétention du point de vue des petites et moyennes Quatorze projets sont en cours de réalisation concernant la formation ou des référentiels de compétences. entreprises. Par exemple, le poste de scientifique de données est l’emploi le plus touché par la pénurie de main-d’œuvre, avec un nombre d’offres d’emploi multiplié par deux en l’espace d’une année, et des centaines de milliers de postes Les besoins en talents restent immenses. Selon une étude récente de McKinsey Global Institute (2020), 87 % des organi- vacants à l’échelle mondiale (Hurtgen et al., 2020). sations sont déjà confrontées à cette pénurie ou s’attendent à l’être dans un futur proche. Alors que les technologies de rupture comme l’IA ont un impact significatif sur la modification des compétences, deux-tiers des répondants identifient le recrutement comme solution pour relever ce défi, alors que 56 % optent pour la formation et la reformation du personnel. Recommandations de la Stratégie québécoise pour l’essor de l’écosystème québécois en intelligence artificielle (Forum IA Québec, 2018) Investissements publics majeurs Dans ce contexte de grande concurrence pour attirer les talents, des recommandations émergent et font consensus : 1 Alors que les retombées économiques mondiales de l’IA devraient atteindre les 20 000 milliards de dollars d’ici 2030 Augmenter la capacité d’attirer des chercheurs. (Forum IA Québec), les États (comme les États-Unis, la Chine ou le Japon) s’empressent d’investir dans le développement de l’IA et les infrastructures en mégadonnées. Dans cette compétition d’innovation technologique, le Canada et le Québec ont déployé une série d’investissements publics majeurs afin de conforter leur avance scientifique et d’en accélérer les 2 retombées économiques et sociales. Assurer l’afflux - en quantité et en qualité - d'étudiants locaux et étrangers dans les cycles supérieurs. Figure 4 : Financement public annoncé pour le développement de l’IA au Québec depuis 2016 (Forum IA Québec, p. 14) 3 Dresser et maintenir un portrait clair et exhaustif pour l’ensemble des acteurs des besoins, des manques et des possibilités en matière de compétences en sciences numériques. Subvention fédérale de 93,6 M$ sur 7 ans octroyée par le 2016 Fonds d’excellence en recherche Apogée dans le cadre du projet « Données au service des Canadiens » mené par l’IVADO. 4 Soutenir les établissements d’enseignement dans l’actualisation de leur offre de formation. Financement de 25 M$ sur 5 ans octroyé au CRIM par 2017 le ministère de l’Économie et de l’Innovation (MESI). 5 Promouvoir la littératie mathématique et la démocratisation des sciences. Octroi d’un budget de 100 M$ sur 5 ans par le MESI 2017 dans l’optique d’accélérer et optimiser le développement de l’écosystème québécois en IA. 6 Faciliter l’accès à l’information sur les ressources disponibles pour les acteurs de l’écosystème en IA et favoriser leur mise en relation par l’entremise d’une vitrine commune. Subvention fédérale de 44 M$ au MILA dans le cadre 2017 de la stratégie pancanadienne en matière d’IA (CIFAR). Le développement des compétences en IA et en science des données est donc un prérequis fondamental pour faire face Octroi d’un financement du gouvernement fédéral de 230 M$ à la pénurie de talents, qui devrait s’amplifier. À ce propos, les universités se sont rapidement adaptées à l’évolution des 2018 Scale AI, complémenté par 53 M$ du gouvernement provincial (QC). besoins du marché en offrant de nouveaux programmes menant à l’obtention de diplômes et de certificats en IA, science des données, mégadonnées et analytique. 16 17
2 DÉFINITION DU DOMAINE DE L’INTELLIGENCE NUMÉRIQUE 18 19
Note méthodologique Une technologie habilitante Quatre éléments fondamentaux Les applications de l’IA ont crû substantiellement ces Plus précisément, les experts interrogés par dernières années (comme dans le transport de marchan- TECHNOCompétences distinguent quatre éléments Dans un premier temps, l’équipe projet a mené une série au plus près la réalité des acteurs de l’industrie de l’IA au dises, la simulation vocale et la reconnaissance visuelle, la fondamentaux quant à l’IA : d’entrevues individuelles auprès d’experts de l’industrie Québec. Les entrevues ont été retranscrites en verbatim prévision météorologique, la calligraphie, les diagnostics afin de mieux comprendre la réalité et les défis associés et analysées qualitativement par codification thématique médicaux, la composition musicale, la rédaction de codes 1 Il s’agit d’une science qui permet d’accorder des à la main-d’œuvre en intelligence artificielle, science (NVivo). capacités de raisonnement humain à logiciels, etc.) et pénètrent progressivement l’ensemble des données et mégadonnées au Québec. De nature une machine ; Profil des experts en IA : les experts sont majoritairement des secteurs d’activité. À cet effet, 85 % des solutions d’IA semi-structurée, ces entrevues d’environ une heure ont localisés dans la région de Montréal (66,7 %) et sont princi- commercialisées seront concrètement appliquées dans 2 Elle utilise des algorithmes comme outils et permis d’obtenir la définition des concepts à l’étude tels palement des hommes (77,8 %). Tous exercent des postes l’industrie d’ici à 2023 (Gartner, 2020). facilitateurs de prises de décision et d’actions ; que perçus et vécus par les experts. Ces entrevues ont permis de retracer les différentes étapes de la transforma- de cadres dans des entreprises qui sont impliquées dans l'IA (développement de produits propulsés par l’IA, ser- 3 Elle touche à l’analyse de données afin tion numérique (de la création à l’intégration de solutions vice-conseil en IA, institut de recherche en IA, etc.). de résoudre des problèmes et d’en tirer d'IA) et d’identifier les différents postes, structures des connaissances ; d’équipes, compétences, connaissances et outils utilisés par les professionnels en IA pour chacune de ces étapes. 4 Il s’agit, dans la majorité des cas, Cette démarche permet d’offrir une perspective qui reflète d’un outil prédictif. Définition de l’IA L’expression « intelligence artificielle » désigne la conception de systèmes informatiques qui sont capables de présenter La recherche opérationnelle et la science de certains attributs de l’intelligence humaine (comme l’apprentissage, la réflexion, la résolution de problème, le raisonne- l’aide à la décision (« decision science ») ment, l’élaboration de stratégies) (Forum IA, 2018). Il existe deux types d’intelligence artificielle : L’IA, dans la plupart de ses utilisations, est plus proche de la recherche opération- nelle et de la science de la décision que de la robotique. Elles partagent l’emploi de techniques issues des sciences mathématiques visant à déterminer des solutions telles que la modélisation mathématique, l’analyse statistique et l’optimisation. L’intelligence L’intelligence artificielle « faible » artificielle « générale » qui désigne une machine ou un programme capable qui désigne une machine ou un d’effectuer une tâche programme capable d’apprendre précise potentiellement de multiples tâches et de transférer très complexe, mais ses connaissances d’un problème spécialisée, comme jouer à un autre, comme le ferait un efficacement au Go ; être humain. À ce jour, seules des formes d’intelligence artificielle « faible » existent, bien qu’elles concernent des tâches de plus en plus complexes. 20 21
Les types d’apprentissage Le détecteur de pourriels L’IA et son développement reposent essentiellement sur Figure 5 : Les algorithmes les plus utilisés (n=75) trois grandes catégories d’algorithmes d’apprentissage Utiliser des techniques de programmation traditionnelles pour détecter un pourriel automatique : reviendrait à coder en dur (« hardcode ») un algorithme de détection pour chacun 33,33 % Méthode de régression des mots suspectés d’être présents dans un pourriel (ex. « vous avez gagné un 1 L’apprentissage supervisé permet d’inférer des (linéaire, logistique) concours », « gratuit », etc.). En revanche, un même filtre basé sur des techniques règles dont la valeur des résultats est connue à 25,33 % Arbre de décision (Decision Tree) d’apprentissage automatique peut identifier les bons prédicteurs en détectant des partir d’exemples bien programmés et définis. Ces patrons présents dans les données d’observation. Le programme sera plus court, exemples permettent à la machine de dévelop- 16,00 % Autres algorithmes plus facile à maintenir avec le temps et probablement plus précis. per des prédictions dont la précision dépend de 14,67 % Autres méthodes d’apprentissage la qualité, mais aussi du volume d’entraînement profond (Auto-encoder, Transformer de l’algorithme. Networks. GANs, RL) 14,67 % Méthode d’apprentissage 2 L’apprentissage non supervisé permet à la ensembliste (Random Forest) machine de détecter des patrons (« patterns ») dans les données de manière autonome. La 13,33 % Partitionnement de données machine identifie les répétitions dans les données (k-means, hiérarchique) Les utilisations de l’IA Vers une IA explicative (bien souvent disparates et non structurées/éti- 10,67 % K plus proches voisins (KNN) quetées) et les catégorise en fonction de leurs La diffusion de l’IA dans le monde des affaires se caractérise Cependant, l’IA devient de plus en plus sophistiquée et 10,67 % Réseau de neurones récurrents récurrences et similarités. de plusieurs manières : certaines organisations conçoivent peut parvenir à des décisions qui proviennent de processus (RNN) de l’IA tandis que d’autres intègrent ou utilisent l’IA dans opaques (problématique de la « boîte noire »). Dans ce cas 3 L’apprentissage par renforcement repose sur 9,33 % Réseau neuronal convolutif (CNN) les solutions qu’elles proposent à leurs clients. Plus encore, de figure, l’expertise humaine devient primordiale pour l’utilisation d’un dispositif/agent autonome, tel 8,00 % Perceptron multicouche (MLP) certaines organisations intègrent l’IA dans une démarche expliquer les comportements et les résultats de la machine. un robot, qui apprend à réviser et adapter ses interne d’optimisation. Certaines grandes entreprises tech- À cet effet, l’IA explicable (un domaine en expansion de actions sur la base d’expériences régies par des 6,67 % Approches bayésiennes nologiques parviennent à regrouper les différents pôles de l’apprentissage automatique) permet d’évaluer les algo- règles d’action au sein d’un environnement fermé. 6,67 % Réseau récurrent à mémoire la chaine de valeur de l’IA en utilisant l’IA à la fois dans leur rithmes décisionnels de la boîte noire afin de les rendre Les actions de l’agent sont alors renforcées (ou court et long terme (LSTM) conception et dans leur organisation interne. plus transparents et ainsi mieux comprendre le raisonne- récompensées) positivement ou négativement, 4,00 % Réduction de la dimension ment de la machine. La traçabilité et la vérifiabilité des ce qui lui permet d'adopter au fil du temps les (PCA, t-SNE) algorithmes décisionnels sont des enjeux majeurs pointés comportements décisionnels souhaités (et Un besoin massif de données par les experts. Sur la base des prédictions Gartner (AI souhaitables). Business, 2020), tous les professionnels en IA devront présenter une expertise en développement responsable Figure 6 : Les cadres d’apprentissage automatique les plus utilisés (n=75) Par-delà leurs spécificités, ces trois grandes catégories de l’IA d’ici à 2023. d’apprentissage automatique requièrent la présence d’une Trois cadres prédominent quantité massive d’informations. De plus, la puissance de calcul et la disponibilité des mégadonnées ont permis le développement et la sophistication d’algorithmes 40 % qui offrent la possibilité d’aborder des problématiques complexes qui ne pouvaient être résolues avec des 30 % méthodes traditionnelles. Les algorithmes d’apprentis- sage profond sont d’autant plus performants qu’ils néces- 20 % sitent une quantité colossale de données. Ces dernières 10 % comprennent très souvent des millions voire des milliards d’éléments sous-jacents de données, qui eux-mêmes 0% peuvent avoir des milliers de caractéristiques ramifiées (Davenport, 2018). Scikit-learn PyTorch TensorFlow Autres Xgboost RandomForest Keras Fast.ai SparkMLib LightGBM Catboost H20 MATLAB 22 23
Les « V » des mégadonnées AlexNet Les mégadonnées se définissent par plusieurs caracté- Le 30 septembre 2012, un réseau de neurones convolutif (« convolutional neural network ») ristiques (allant des 3 V jusqu’aux 7 V)3, dont certaines appelé AlexNet a remporté le ImageNet 2012 Challenge avec un taux d’erreur de 10,8 % demeurent centrales : inférieur à celui du finaliste. Cela a été rendu possible grâce à l’utilisation d’unités de traite- ment graphique (« graphic processing unit ») pendant l’entraînement, un ingrédient essentiel 1 2 3 de la révolution de l’apprentissage profond. Les réseaux sont dorénavant beaucoup plus gros, certains ayant une capacité de 175 milliards de paramètres. Figure 7 : Schématisation d’AlexNet Volume Vélocité Variété 3 3 3 La quantité de données est Les données sont générées Les mégadonnées sont 5 3 5 3 3 telle que les outils tradition- à une vitesse sans précédent souvent de différentes 3 11 48 192 192 128 2048 2048 Dense nels de gestion des données depuis différentes sources natures (texte, éléments 11 128 55 27 13 13 ne suffisent plus pour les numériques (capteurs, audio ou vidéos, entrées 13 5 3 3 stocker et les analyser. communications électro- numériques, phénomènes 224 5 3 3 3 niques, etc.), offrant ainsi la physiques captés par des 13 3 13 13 Dense Dense 27 3 possibilité d’une analyse en capteurs sensoriels, etc.), 11 3 11 55 192 192 128 1000 temps réel. Les mégadonnées peuvent être structurées Max 224 Max Max Pooling 2048 2048 permettent aux organisations ou non structurées et pro- Stride of 4 Pooling Pooling d’être agiles dans l’analyse et viennent de sources internes 3 48 la capture de valeur produite et externes. La fusion de par les données. données provenant de dif- férentes sources reste un Définition des mégadonnées procédé complexe. Les mégadonnées influencent aujourd’hui un grand le développement des infrastructures de données. Les nombre de résultats organisationnels et sociétaux. Par mégadonnées sont aussi extrêmement populaires sur les conséquent, l’intérêt de la communauté d’affaires envers réseaux professionnels, avec des milliers de publications Le traitement distribué des données les mégadonnées s’est fortement et rapidement accru. LinkedIn écrites sur le sujet (Huselid & Minbaeva, 2018). L’émergence d’un tel engouement repose sur la crois- sance exponentielle du nombre de données disponibles Les mégadonnées représentent le domaine de l’intelli- Si les données sont souvent considérées comme la et la démocratisation des solutions d’infonuagiques (cloud gence numérique pour lequel la définition donnée par les matière première du XXIe siècle, ce sont les capacités ana- computing) permettant d’abaisser les coûts de stockage et experts interrogés dans cette étude est la plus consen- lytiques qui permettent d’en extraire de précieuses pers- d’hébergement des données. De plus, le développement suelle. Ils parlent de mégadonnées lorsqu’il y a un chan- pectives. Dans cette optique, les experts qui travaillent de l’IA et la sophistication des techniques d’apprentissage gement d’échelle si important dans le volume de données avec des mégadonnées utilisent des outils de traite- automatique facilitent considérablement l’analyse et la qu’une machine (ou un ordinateur standard) ne suffit plus ment distribué de données, Hadoop et les technologies conversion des mégadonnées en connaissances à valeur pour les stocker et les traiter. MapReduce, Spark et Kafka figurant parmi les principaux. ajoutée (McKinsey, 2017). Poussés par l’impératif de capter Les applications comme Excel et SPSS ne permettent pas des données de qualité en temps réel, les entreprises et les de traiter des données volumineuses. Le travail se fait alors gouvernements investissent des milliards de dollars dans de manière programmatique, soutenu par une infrastruc- ture de données où plusieurs parties d’un seul ensemble de données peuvent être dispersées sur plusieurs serveurs. 3 Les quatre V restants sont la véracité, la variabilité, la valeur et la visualisation. 24 25
Figure 8 : Schématisation d’un traitement distribué de données Figure 9 : Les produits d’infonuagiques les plus régulièrement utilisés dans le cadre du travail d’un professionnel en intelligence numérique Fichier 1 Morceau 1 Serveur 1 Fichier 1 Morceau 2 Google Cloud Functions Fichier 2 Morceau 1 12 % Fichier 1 Morceau 2 Morceaux redondants Google App (présents à plusieurs endroits), IBM Watson Engine Application Shématisation (mapping) Serveur 2 Fichier 1 Morceau 1 prêts à passer à l’action 7% 7% en cas de problème Azure Fichier 2 Morceau 2 Databricks 12 % AWS S3 AWS Sagemaker 29 % Fichier 1 Morceau 2 IBM Cloud 7% 7% Azure Virtual Serveur 3 Fichier 2 Morceau 1 Machines Fichier 2 Morceau 2 26 % AWS Elastic AWS Elastic Un même fichier peut être fragmenté Beanstalk Compute Cloud (EC2) (chunks) dans plusieurs serveurs Google Compute 5% 19 % Engine (GCE) 14 % AWS Lambda AWS EMR Databricks 12 % 5% 7% Les services en infonuagique Azure Batch 7% Les entreprises qui adoptent les mégadonnées cherchent tions en matière de cybersécurité et de protection des à développer des infrastructures fiables et flexibles, offrant données. La notion de gouvernance des données devient Google AI une grande disponibilité. De plus en plus, les services en un enjeu crucial, confirmé lors des entrevues avec les Google Colab Azure Container Platform infonuagique semblent être priorisés pour une quantité experts. Elles révèlent d’ailleurs les principaux facteurs 26 % Service 12 % de données très importante avec un niveau de sensibi- qui orientent le choix des acteurs en matière d’outils de 17 % lité modéré. Les principaux services en infonuagique et de stockage des données, à savoir : Google Kubernetes stockage de données sont, d’après les experts, Amazon Engine Web Services dont Redshift, Microsoft Azure et les • Le volume des données ; 10 % services de Google, qui peuvent engendrer des coûts très • La fréquence d’accès aux données, et ; importants pour les entreprises. Cela étant, l’externalisa- tion de la gestion d'une infrastructure informatique réduit • Le niveau de sensibilité des données. les risques financiers associés aux investissements dans une infrastructure qui peut rapidement ne plus répondre À titre d’exemple, imaginons une entreprise en ser- à la rapidité d’évolution des technologies (Ren et al., 2015). vice-conseil qui détermine une solution de stockage des données en fonction des besoins de son client. Les L’infonuagique étant aujourd’hui largement utilisée (les données considérées comme très sensibles seraient alors technologies de traitement distribué des données y sont probablement traitées sur des serveurs privés, plus com- étroitement liées), les experts expriment des préoccupa- munément appelés « in house ». (Ren et al., 2015). 26 27
Vous pouvez aussi lire