PROFIL DE LA MAIN D'ŒUVRE - EN INTELLIGENCE ARTIFICIELLE, SCIENCE DES DONNÉES ET MÉGADONNÉES AU QUÉBEC - TECHNOCompétences

La page est créée Thierry Maurice
 
CONTINUER À LIRE
PROFIL DE LA MAIN D'ŒUVRE - EN INTELLIGENCE ARTIFICIELLE, SCIENCE DES DONNÉES ET MÉGADONNÉES AU QUÉBEC - TECHNOCompétences
PROFIL DE LA
  MAIN D’ŒUVRE
EN INTELLIGENCE ARTIFICIELLE, SCIENCE DES DONNÉES
           ET MÉGADONNÉES AU QUÉBEC

                            En partenariat avec

                                                    1
Éditeur

TECHNOCompétences, le Comité sectoriel de main-d’œuvre en technologies de l’information                                     Pour citer ce rapport :
et des communications, Mélanie Bosc, directrice générale.

                                                                                                                            Cayrat, C., Sigouin-Lebel, A., & Poirier St-Pierre, G. (2021). Profil de la main-d’œuvre en intelligence artificielle,
                                                                                                                            science des données et mégadonnées au Québec. TECHNOCompétences, Montréal, 113 p.
Direction de l’étude                                                Comité de pilotage
Aubert Sigouin-Lebel, Chargé de la recherche,
TECHNOCompétences                                                   Brian Moore,
                                                                    Institut de valorisation des données (IVADO)            Ayant fait l’objet d’une approbation par le comité scientifique, cette étude sera présentée à l’occasion
Analyse et rédaction                                                                                                        du 88e Congrès de l’ACFAS (Association Francophone pour le Savoir) en mai 2021
Charles Cayrat, Chercheur doctoral,                                 Émélie Brunet,
Université d’Auckland                                               Institut Québécois d’Intelligence Artificielle (Mila)
                                                                                                                            Cayrat, Charles. (2021). Le profil de main-d’œuvre en intelligence artificielle, science des données et
Aubert Sigouin-Lebel, Chargé de la recherche,                       Aurélie Sénéchal-Parfait,
                                                                                                                            mégadonnées au Québec : proposition d’une taxonomie des métiers et des compétences.
TECHNOCompétences                                                   Centre de recherche informatique de Montréal (CRIM)
                                                                                                                            Communication présentée au 88e Congrès de l’ACFAS, Montréal.
Analyse support                                                     Réjean Roy, Forum IA Québec
Guillaume Poirier St-Pierre, Conseiller Principal, Optimum Talent
                                                                    Benoît Pagé, Pôle montréalais d’enseignement            Cette étude a été réalisée grâce à l’aide financière du Conseil Emploi Métropole (CEM)
Conception graphique                                                supérieur en intelligence artificielle (PIA)
Émilie Jobin, Graphiste
                                                                    Tim Fournier, Conseil Emploi Métropole (CEM)
Révision
Clotilde Morin, Rédactrice                                          Charles Rémillard, Finance Montréal

Traduction et francisation                                          Florian Saugues, Numana
Caroline Dallaire, Versacom
                                                                    Ugo Ceppi, Direction de l’analyse et de l’information
                                                                    sur le marché du travail (DAIMT)
                                                                                                                            550 rue Sherbrooke Ouest – Tour Ouest, bureau 350, Montréal (Québec), H3A 1B9
                                                                    Nancy Barbeau, Ministère de l’Enseignement supérieur    Téléphone : 514-840-1237
                                                                                                                            info@technocompetences.qc.ca · www.technocompetences.qc.ca
                                                                    Anne-Louise Brassard,
                                                                    Ministère de l’Enseignement supérieur

                                                                    Jesus Jimenez-Orte, Ministère de l’Éducation
                                                                                                                            © TECHNOCompétences, 2021
                                                                    Claire Adam, Ministère de l’Économie                    ISNB 978-2-925166-00-9
                                                                                                                            Dépôt légal – Bibliothèque nationale du Québec, 2021

2                                                                                                                                                                                                                                                    3
TABLE DES MATIÈRES

        Éditeur                                                             2   4   PORTRAIT GLOBAL DE L’EMPLOI                                                        38
        Mot de la direction                                                 7
        Introduction                                                        8
                                                                                5   TAXONOMIE DES MÉTIERS DE L’INTELLIGENCE NUMÉRIQUE                                  44
        Éléments traités dans l’étude                                       8
        Méthodologie                                                        8       Taxonomie                                                                          46
        Schéma méthodologique                                               9       Note méthodologique                                                                47
                                                                                    Fiches métiers                                                                     48
                                                                                    Visualisation des sources de données                                               48
    1   CONTEXTE                                                           10
                                                                                    Répartition industrielle de la taxonomie des métiers de l’intelligence numérique   68
        Portrait d’un écosystème en IA de premier rang mondial             12
        Une adoption encore timide                                         12
                                                                                6   ÉTAT DE LA DEMANDE DE COMPÉTENCES                                                  70
        La genèse de l’IA à Montréal et au Québec                          13
        L’arrivée de géants technologiques au Québec                       13       Note méthodologique                                                                72
        Constitution d’un écosystème québécois en IA                       14       Intelligence numérique : les besoins en main-d’œuvre                               72
        Développer le bassin de talents en IA : Une priorité absolue       16       Le processus d’embauche en intelligence numérique                                  73
        Investissements publics majeurs                                    17       Les facteurs déterminant l’embauche en intelligence numérique                      74
                                                                                    Les besoins en main-d’œuvre à court terme                                          79
                                                                                    Les besoins futurs en main-d’œuvre                                                 81
    2   DÉFINITION DU DOMAINE DE L’INTELLIGENCE NUMÉRIQUE                  18
                                                                                    État de la formation                                                               82
        Note méthodologique                                                20       Les éléments distinctifs de la formation en intelligence numérique au Québec       82
        Définition de l’IA                                                 20       Les universités et instituts de recherche québécois qui se démarquent              83
        Une technologie habilitante                                        21       Les principales forces des talents sortant de ces programmes                       83
        Quatre éléments fondamentaux                                       21       Les principales lacunes des programmes proposés                                    84
        Les types d’apprentissage                                          22       Le programme de formation idéal en intelligence numérique                          85
        Les utilisations de l’IA                                           23       Les stages et la formation en entreprise                                           86
        Un besoin massif de données                                        23
        Vers une IA explicative                                            23
                                                                                7   CONCLUSION ET AVENUES DE RECHERCHE FUTURES                                         88
        Définition des mégadonnées                                         24
        Les « V » des mégadonnées                                          25
        Le traitement distribué des données                                25   8   ANNEXES                                                                            92
        Les services en infonuagique                                       26       Visualisation des réponses du sondage auprès de professionnels                      94
        Définition de la science des données                               29       en intelligence numérique
        Les principaux éléments de la science des données                  29       Matrice Emploi/Outils numériques et technologies                                   104
                                                                                    Liste des figures                                                                   112
    3   LE PROCESSUS DE CRÉATION ET D’INTÉGRATION DE L’IA                  32       Bibliographie                                                                       113

        L’identification des problématiques et l’orientation stratégique   34
        La preuve de concept                                               35
        La production                                                      36
        L’adoption                                                         37

4                                                                                                                                                                             5
MOT DE LA
    DIRECTION
    Ces dernières années, le Québec a connu une efferves-            5   Des fiches métiers traitant de l’estimation du
    cence remarquable concernant l’intelligence artificielle             bassin de talents et incluant de multiples informa-
    (IA), notamment grâce à l’excellence en recherche acadé-             tions spécifiques (salaires, tâches principales, référen-
    mique dans ce domaine qui a entraîné l’arrivée de géants             tiel de compétences techniques et transversales) ;
    de la technologie, la création d’entreprises québécoises
    en démarrage et la mise sur pied d’instituts de recherche        6   Une répartition industrielle des métiers de l’intelli-
    de renom. De multiples efforts ont été déployés afin de              gence numérique
    propulser l’essor d’un écosystème riche et stimulant en
    intelligence artificielle, envié mondialement. Mais restait      7   Un portrait de la demande de compétences et de
    un élément fondamental à examiner plus en profondeur :               la formation, incluant les forces et défis concer-
    la main-d’œuvre.                                                     nant ce profil de talents qui change à une vitesse
                                                                         déstabilisante.
    Il était donc important pour TECHNOCompétences de
    saisir cette opportunité à travers la réalisation d’un profil
                                                                     8   L’ensemble de nos données sur l’utilisation des outils
    de la main-d’œuvre en intelligence artificielle, science des
                                                                         numériques, sous la forme de matrices Emploi/Outils
    données et mégadonnées au Québec proposé aujourd’hui.
                                                                         numériques et technologies, en annexe du document.
    TECHNOCompétences déploie toute son énergie à
                                                                    Un peu partout, nous y avons ajouté des faits explicatifs
    soutenir les entreprises du secteur et le développement
                                                                    ainsi que des informations basées sur les données que nous
    des compétences numériques, que ce soit par la produc-
                                                                    avons recueillies.
    tion d’études, d’outils de gestion des ressources humaines
    ou encore par le partage d’expertises. Le présent profil est    Nous tenons à remercier la contribution de nos partenaires
    un exemple de contribution du Comité sectoriel.                 dans ce projet. En premier lieu, le Conseil emploi métropole
                                                                    pour sa contribution financière à la réalisation du projet.
    Dans ce profil, vous trouverez :
                                                                    Nous remercions également les membres du comité de
                                                                    pilotage qui, de par leurs commentaires et rétroactions, se
     1   Une revue historique de la position du Québec en           sont engagés à faire de ce profil une réussite.
         matière d’intelligence artificielle ;
                                                                    Bonne lecture !
     2 Une définition de la main-d’œuvre du secteur ;
                                                                    Mélanie Bosc
     3 Un portrait global de l’emploi ;                             Directrice générale

     4 Une taxonomie des métiers de l’intelligence
       numérique – que nous définissons comme étant la
       main-d’œuvre spécialisée en intelligence artificielle
       ainsi que les métiers périphériques essentiels reliés ;

6                                                                                                                                 7
INTRODUCTION

Éléments traités dans l’étude                                                                                                 Schéma méthodologique
L’avènement de l’intelligence artificielle (IA), la science    En évolution constante et sujettes à de multiples interpré-                                                                                                     Note
des données et les mégadonnées (big data) entraîne             tations, nous présentons en premier lieu les définitions des                                                     Instruments de collecte et
                                                                                                                                         Sections traitées                                                                méthodologique
des changements technologiques et socioéconomiques             concepts d’intelligence artificielle, de science des données                                                        sources de données
                                                                                                                                                                                                                          correspondante
majeurs dont les impacts sur les organisations demeurent       et de mégadonnées tels que perçus par les professionnels
opaques. Afin de mieux comprendre l’ampleur de ces             de l’industrie au Québec. Les résultats de recherche font
changements sur les entreprises, la présente étude vise à      également état du processus de création et d’intégration           I     Contexte                             Revue de littérature professionnelle                -
proposer le premier profil de la main-d’œuvre en intelli-      de l’IA dans l’entreprise, présentent une estimation du
gence numérique au Québec.                                     nombre de professionnels travaillant dans les domaines de
                                                               l’intelligence numérique et offrent une première taxonomie         II    Définition du domaine de           Entrevues individuelles semi-structurées           Page 20
Celle-ci repose sur la combinaison de méthodes de              des métiers distinguant les professionnels techniques des                l’Intelligence Numérique                auprès d’experts de l’industrie
recherche qualitative et quantitative comprenant une           professionnels d’interface. Enfin, nous proposons une                                                                  de l’IA au Québec
série d’entrevues semi-structurées auprès d’experts de l’in-                                                                      III   Le processus de création et
                                                               cartographie des profils de compétences de ces métiers
dustrie de l'IA au Québec, deux sondages auprès de pro-                                                                                 d’intégration de l’IA
                                                               émergents et présentons les besoins et programmes de
fessionnels en IA (n=75) et TIC (n=400), ainsi que l’analyse   formation correspondants.
thématique de 13 500 offres d’emplois en ligne.
                                                                                                                                  IV Portait global de l’emploi             Base de données Gartner répertoriant
                                                                                                                                                                             13 500 annonces d’emplois en ligne
                                                                                                                                  V     Taxonomie des métiers
                                                                                                                                        de l’Intelligence Numérique     Entrevues individuelles semi-structurées auprès       Page 47
                                              MOTS-CLÉS :                                                                               (19 fiches-métiers)                d’experts de l’industrie de l’IA au Québec

                                                                                                                                  VI 19 Fiches métier de                       Sondage (n=75) réalisé auprès de
                                                                                                                                        l’intelligence numérique              professionnels occupant un emploi
                                                                                                                                                                             relié à l’IA, aux mégadonnées ou à la
                      INTELLIGENCE NUMÉRIQUE Profil main-d’œuvre                                                                  VII Répartition industrielle                 science des données au Québec.
                                                                                                                                        des métiers de l’intelligence
                      Intelligence Artificielle MÉGADONNÉES                                                                             numérique
                      BIG DATA SCIENCE DES DONNÉES Emplois
                      COMPÉTENCES Formation QUÉBEC
                                                                                                                                  VIII État de la demande                 Communauté en ligne composée d’experts              Page 72
                                                                                                                                        de compétences                      en intelligence numérique au Québec.
                                                                                                                                                                              Entrevues téléphoniques de suivi.
                                                                                                                                  IX État de la formation
                                                                                                                                                                              Sondage (n=400) réalisé auprès de
                                                                                                                                                                              professionnels évoluant dans une
                                                                                                                                                                            entreprise du secteur des TI au Québec
Méthodologie
La présente étude repose sur la combinaison de méthodes        Toutes les données primaires utilisées et restituées dans
de recherche qualitative et quantitative permettant la         le présent rapport ont été collectées en respectant les            X     Matrices Emploi/Outils              Base de données Gartner répertoriant                 -
collecte et l’analyse de données primaires et secondaires.     principes éthiques généralement établis en recherche uni-                numérique                            13 500 annonces d’emplois en ligne
Les données sont en provenance de sources publiques et         versitaire. Ceux-ci garantissent confidentialité et anonymat
privées.                                                       à l’ensemble des participants. Chacun d'entre eux a accepté
                                                               les conditions de la recherche par la signature d’un formu-
                                                               laire de consentement prévu à cet effet.

8                                                                                                                                                                                                                                          9
1   CONTEXTE
Portrait d’un écosystème en IA                                                                                                                       La genèse de l’IA à Montréal et au Québec
de premier rang mondial

Les métiers de l’intelligence numérique1 au Québec sont                              son avant-gardisme dans la recherche fondamen-                  Créés respectivement en 1985 et 1990, le Centre for                                      l’intérêt pour l’apprentissage profond est marquée d’un
en effervescence. Ils participent à une tendance mondiale                            tale et appliquée en IA, la présence de pôles novateurs         Intelligent Machines et le Reasoning and Learning Lab de                                 côté par la publication d’articles novateurs et de l’autre par
à la promotion du développement des infrastructures                                  d’hébergement, de protection et de valorisation des             l’Université McGill se spécialisent alors dans les systèmes                              l’applicabilité croissante de cette technologie grâce aux
de données et des talents en intelligence numérique.                                 données, ainsi que son bassin d’experts, chercheurs et          probabilistes, le traitement de langage naturel, l’apprentis-                            nouvelles capacités de calcul et de stockage des données.
Les avancées technologiques progressent à un rythme                                  étudiants en IA, parmi les plus importants au monde.            sage par renforcement et l’application de l’IA en robotique.                             Dès lors, le talent en apprentissage profond devient une
soutenu à travers la planète : elles poussent les nations à                                                                                          Durant cette même période nait le centre de recherche                                    spécificité très recherchée par les grandes entreprises
repenser leurs modèles socioéconomiques et à promou-                                                                                                 en informatique de Montréal (CRIM), qui développe dès                                    technologiques.
voir le développement des infrastructures de données                                                                                                 ses premières années des outils de reconnaissance de la
et d’intelligence artificielle (IA). Les dépenses mondiales                                  Une adoption encore timide                              parole.
reliées aux systèmes d’IA devraient d’ailleurs atteindre 110
milliards de dollars US d’ici à 2024, soit une croissance de                                                                                         En 1993, c’est l’Institut québécois d’intelligence artificielle
100 % (IDC, 2020). La concurrence est féroce et ce qui en                            Si l’IA présente des potentiels de gains en productivité        (Mila) qui voit le jour grâce au professeur Yoshua Bengio
                                                                                                                                                     de l’Université de Montréal. Reconnu mondialement pour                                                                     est une bibliothèque
découle est lourd de conséquences. Le leadership en IA                               évidents, son intégration dans les organisations demeure
                                                                                                                                                     ses importantes contributions au domaine de l’apprentis-                                      Python pour l’apprentissage automatique créée et
et en gestion des données est donc devenu crucial dans                               complexe, considérant son impact sur l’évolution des                                                                                                          maintenue initialement par Mila, et ce, dès 2007.
un contexte où les pays les plus avancés sont ceux qui                               processus organisationnels, des modèles d’affaires et les       sage profond, Mila se distingue dans la modélisation du
                                                                                                                                                                                                                                                   Theano témoigne du caractère précurseur de certains
en tireront le maximum d’avantages économiques. Car                                  changements stratégiques et culturels qui en découlent. En      langage, la traduction automatique neuronale, la recon-
                                                                                                                                                                                                                                                   chercheurs basés à Montréal.
comme l’a démontré l’implantation de certaines techno-                               effet, les résultats d’un récent sondage mené par Deloitte      naissance d’objets et les modèles génératifs. La hausse de
logies par le passé (comme la 4G), les pionniers sont aussi                          (2019) auprès de citoyens canadiens et d’entreprises inter-
ceux qui fixent les règles du jeu et qui assurent leur com-                          nationales identifie le manque de connaissances en IA, le
pétitivité dans un futur plus que jamais numérique. Dans                             manque de confiance dans les décisions prises par l’IA, la
ce contexte et par des stratégies innovantes (CIFAR, 2019,                           difficulté à collaborer avec les fournisseurs et à démontrer
Forum IA Québec, 2018), le Québec s’est doté d’un plan                               la valeur générée par l’IA ainsi que les problématiques d’in-
ambitieux pour figurer parmi les leaders mondiaux en                                 tégration et de mise en œuvre de l’IA comme principaux
intelligence numérique.                                                              obstacles à l’adoption de cette technologie par les entre-
                                                                                                                                                     L’arrivée de géants technologiques au Québec
                                                                                     prises canadiennes. De plus, seuls 31 % des entreprises
Le Québec ne part pas de zéro concernant la promotion                                ayant adopté l’IA qualifient leur déploiement de réussite       Attirées par l’essor de Mila et l’effervescence de l’écosys-                             industriel qu’universitaire, et complémente les initiatives
de l’industrie et des talents en intelligence numérique.                             (Reynolds, 2018). Force est d’admettre que l’adoption de        tème québécois, plusieurs entreprises multinationales ont                                gouvernementales avec le déploiement d’investissements
Fleuron de l’économie numérique canadienne, le Québec                                l’IA est à la fois une opportunité et un défi.                  fait le choix de s’établir à Montréal. L’arrivée de ces entre-                           massifs (plus de 700 M$ depuis 2016).
est reconnu à l’échelle internationale pour l’excellence                                                                                             prises technologiques dynamise le milieu, tant sur le plan
de son écosystème en intelligence artificielle. Montréal                             Un retour sur le positionnement historique de Montréal
abrite aujourd’hui l’un des écosystèmes en IA les plus                               et du Québec en matière d’IA permet de mieux com-
dynamiques au monde où acteurs industriels et acadé-                                 prendre les enjeux concernant cette technologie et sa           Figure 2 : Arrivée d’entreprises internationales à Montréal (Investissement Québec, 2019)
miques travaillent de concert. Parmi ses forces, notons                              main-d’œuvre.

                                                                                                                                                        NOV. 2016               APRIL 2017                OCT. 2017               JAN. 2018                   MAY 2018               SEPT. 2018               JAN 2019

Figure 1 : Le niveau d’intégration des méthodes de machine learning (ML) des entreprises embauchant un professionnel
en intelligence numérique
                                             Oui, nous utilisons
                                         des méthodes de ML pour
                                         générer des informations           21 %
                                                                                         28 %                Aucune intégration

                                           Oui, nous explorons
                                           les méthodes de ML
                                                                         16 %
                                                                                             9%             Je ne sais pas

                                                                              12 %    13 %
                                      Oui, nous avons récemment                                     Oui, nous avons des
                                          commencé à utiliser                                                                                                       JAN. 2017                SEPT. 2017               OCT. 2017                  MARCH 2018              JUNE 2018                OCT. 2018
                                                                                                    méthodes de ML bien établies
                                         des méthodes de ML

1
 L’intelligence numérique regroupe les emplois techniques en IA, science des données et mégadonnées ainsi
que les emplois périphériques opérant dans « l’interface » de l’entreprise.

12                                                                                                                                                                                                                                                                                                                       13
Ces géants technologiques du secteur privé, principa-                     En 2016 nait l’Institut de valorisation des données (IVADO).
lement américains, exercent toutefois une pression sur                    À l’intersection entre les mondes universitaires et corpora-
le marché des talents en attirant un nombre significa-                    tifs, IVADO démontre l’excellence des travaux québécois en
tif d’experts en IA2. Les producteurs d’IA jouent donc un                 intelligence numérique avec des projets pluridisciplinaires
rôle majeur dans la stimulation de la demande en IA au                    et intersectoriels. En misant sur le transfert technologique,    Figure 3 : Forces et faiblesses des acteurs de l’écosystème québécois en IA (Forum IA Québec, 2018, p. 13)
sein de l’écosystème québécois. Ceci creuse toutefois le                  les instituts comme IVADO, le CRIM, l’Institut Intelligence
fossé entre ces producteurs d’IA, leaders dans le secteur                 et Données (IID) de l’Université Laval ou encore des centres                       FORMATION ET RECHERCHE                              TISSU INDUSTRIEL                         ÉCOSYSTÈME DE SOUTIEN
privé, et les petites et grandes entreprises québécoises                  collégiaux de transfert de technologies en intelligence arti-
consommatrices d’IA qui peinent à amorcer leur virage                     ficielle comme JACOBB constituent une réelle source de                      Expertise de pointe au-delà de McGill et        Récentes levées de fonds de startups         Maturité du capital risque et appétit
numérique. Au-delà des investissements commerciaux                        création de valeur pour l’écosystème en IA.                                 UdeM                                            prometteuses en IA, avec un total de         d’investir dans l’IA.
                                                                                                                                                                                                      ~ 150 M$ au cours des 2 dernières années
colossaux, ces multinationales jouent également un rôle                                                                                               Présence de forces sectorielles propres à                                                    Présence d’un vaste réseau provincial
majeur en recherche. Le Canada compte à cet effet plus                    En 2018 est lancée Scale AI, une supergrappe d’innovation                   chaque université, sur lesquelles bâtir et      Grande effervescence à Montréal créée        d’acteurs historiques du transfert
de 70 grandes entreprises ayant leur propre laboratoire de                fédérale en IA visant à développer les chaines d’approvi-                   créer un potentiel de spécialisation            par l’établissement de 7 centres de          technologique vers les PME, p. ex.,
                                                                                                                                                                                                      recherche par des géants technologiques      Transtech, CEFRIO et le CRIM
recherche en IA (Gagné, 2019).                                            sionnement de nouvelle génération par l’intégration de                      Mouvement d’augmentation de la
                                                                          l’IA afin d’accroître la performance des entreprises cana-                  quantité et qualité de talent embauchés                                                      Présence de plusieurs acteurs à
                                                                                                                                                      par les universités; p. ex., à l’ÉTS et                                                      l’avant-garde des déploiements de
                                                                          diennes. Considérée comme un acteur central de l’éco-                       Polytechnique, 2 fois plus d’étudiants                                                       transformations analytiques et numériques
                                                                          système canadien en IA, Scale AI prévoit de générer un                      en TI en 5 ans                                                                               en grandes entreprises, p. ex., Accenture,
                                                                                                                                                                                                                                                   McKinsey, Deloitte
                                                                          impact de plus de 16,5 milliards $ CA sur le PIB canadien                   Proactivité des acteurs académiques,
                                                                          et la création/amélioration de plus de 16 000 emplois. De                   p. ex., révision en cours de programmes
Constitution d’un écosystème                                              plus, le ministère du Travail, de l’Emploi et de la Solidarité
                                                                                                                                                      connexes à l’IA

québécois en IA                                                           sociale a octroyé en juillet 2019 une aide de 23,4 millions $
                                                                          CA à l’organisation pour appuyer des activités de formation
                                                                          pour plus de 25 000 professionnels, cadres et dirigeants.                   Malgré une collaboration existante,             Écosystèmes de grappes bien                  Les institutions académiques se sont dotées
Plusieurs organisations endossent un rôle central dans                                                                                                opportunité d’améliorer davantage               connectées, mais dont le rôle vis-à-vis      de structures visant à accélérer le transfert
                                                                                                                                                      la coordination entre universités et            de la grappe en IA reste à définir sur       technologique, bien que le format ait
l’exécution de la stratégie provinciale en IA et en gestion               S’inscrivant dans le cadre du Partenariat mondial sur l'in-                 avec les acteurs industriels                    une base individuelle                        besoin d’être précisé
des mégadonnées. La Stratégie pour l’essor de l’écosys-                   telligence artificielle (PMIA), le Centre international
tème québécois en intelligence artificielle (Forum IA                     de Montréal pour l'avancement de l'intelligence artifi-
Québec, 2018) a comme objectif d’unir ces acteurs avec                    cielle (CEIMIA) est créé en juin 2020. Piloté par Montréal                  Difficultés pour attirer le talent              À l’exception des principales entreprises    Force de frappe qui demeure limitée en
l’ambition de « créer au Québec le plus important éco-                    International, il vise à renforcer l’innovation, la commercia-              académique, dues aux ressources                 technologiques, difficulté croissante à      transfert technologique auprès des PME
système d’intelligence artificielle en Amérique du Nord                                                                                               financières et au cadre d'emploi                embaucher des talents en TI
                                                                          lisation et l’utilisation responsable de l’IA et des données.                                                                                                            Capacité de transfert technologique
et développer une force de travail en ce domaine pour                     La participation aux activités du PMIA favorise également                   Fort risque de perdre l’avantage compétitif     Niveau naissant d’intérêt dans les grandes   répartie à travers de multiples acteurs -
                                                                                                                                                      historique - petit bassin de talents            entreprises « non tech » québécoises,        p. ex., Aligo, Univalor, avec des liens plus
enraciner ce créneau et hisser le Québec au rang des                      la collaboration entre les gouvernements des provinces et                   facilement déstabilisable - , crainte           mais manque de compréhension sur le          ou moins proches des universités
principaux concepteurs, utilisateurs et exportateurs de                   du fédéral, tout en développant des partenariats interna-                   de l’écosystème face aux géants                 potentiel de valeur à court terme et de
                                                                                                                                                      technologiques                                  transformation des modèles d’affaires à      Manque de financement de croissance
solutions d’intelligence artificielle ».                                  tionaux (tels que le partenariat stratégique entre le Québec                                                                                                             pour les futures startups à succès
                                                                                                                                                                                                      plus long terme
                                                                          et la France dans le cadre de la Déclaration franco-cana-                   Absence d’arrimage entre la formation
Considéré comme un acteur indispensable de la stratégie,                  dienne sur l’intelligence artificielle).
                                                                                                                                                      universitaire, la formation collégiale et les   Rareté d'entreprises/organisations
                                                                                                                                                      besoins de l’industrie                          d’ancrage pouvant servir de premier client
Mila joue un rôle essentiel dans l’écosystème québécois.
En effet, cet institut compte aujourd’hui la plus importante              Dans cette lignée, le Forum IA Québec a officiellement lancé                Multiplication des acteurs et des alliances     Capital de croissance insuffisant
                                                                                                                                                      à l’intérieur et à l’extérieur du Québec
concentration de chercheurs spécialisés en apprentissage                  ses activités en septembre 2020 avec comme objectif de
automatique au monde (plus de 600, incluant les profes-                   rassembler les acteurs gouvernementaux et non gouver-
seurs), et comporte également 36 chaires de recherche en                  nementaux de l’écosystème québécois en IA, et de pro-
IA sur les 80 du pays. Regroupé dans un nouvel espace de                  mouvoir leur collaboration. Au-delà de ses activités de
90 000 pi2 dans le Mile-Ex, Mila a pour vocation d’être plus              vigie locale et de réflexion stratégique, le Forum favorise
qu’un centre de recherche et de servir de centre de gravité               également le rayonnement de l’écosystème québécois au
pour les entreprises en démarrage, les investisseurs et les               Canada et à l’international.
laboratoires d’entreprises.

2
    46 % selon le Global AI Talent Report de Jean-François Gagné (2019)

14                                                                                                                                                                                                                                                                                                 15
Développer le bassin de talents en IA :
Une priorité absolue

La présence de grands groupes technologiques dessine un écosystème québécois complet capable aujourd’hui de                      De plus, les différents cégeps et universités de Montréal ont suivi l’une des recommandations mentionnées plus haut en
rivaliser avec celui de la Silicon Valley, principal responsable de la fuite des cerveaux canadiens. Toutefois, cette opportu-   créant un lieu de concertation et de collaboration sous la forme d’un pôle montréalais en enseignement supérieur (PIA).
nité accentue la rareté des talents en IA et les difficultés liées à leur rétention du point de vue des petites et moyennes      Quatorze projets sont en cours de réalisation concernant la formation ou des référentiels de compétences.
entreprises. Par exemple, le poste de scientifique de données est l’emploi le plus touché par la pénurie de main-d’œuvre,
avec un nombre d’offres d’emploi multiplié par deux en l’espace d’une année, et des centaines de milliers de postes              Les besoins en talents restent immenses. Selon une étude récente de McKinsey Global Institute (2020), 87 % des organi-
vacants à l’échelle mondiale (Hurtgen et al., 2020).                                                                             sations sont déjà confrontées à cette pénurie ou s’attendent à l’être dans un futur proche. Alors que les technologies de
                                                                                                                                 rupture comme l’IA ont un impact significatif sur la modification des compétences, deux-tiers des répondants identifient le
                                                                                                                                 recrutement comme solution pour relever ce défi, alors que 56 % optent pour la formation et la reformation du personnel.
                       Recommandations de la Stratégie québécoise pour l’essor de
                           l’écosystème québécois en intelligence artificielle
                                                   (Forum IA Québec, 2018)
                                                                                                                                 Investissements publics majeurs
                              Dans ce contexte de grande concurrence pour attirer les talents,
                              des recommandations émergent et font consensus :

                   1
                                                                                                                                 Alors que les retombées économiques mondiales de l’IA devraient atteindre les 20 000 milliards de dollars d’ici 2030
                              Augmenter la capacité d’attirer des chercheurs.                                                    (Forum IA Québec), les États (comme les États-Unis, la Chine ou le Japon) s’empressent d’investir dans le développement
                                                                                                                                 de l’IA et les infrastructures en mégadonnées. Dans cette compétition d’innovation technologique, le Canada et le Québec
                                                                                                                                 ont déployé une série d’investissements publics majeurs afin de conforter leur avance scientifique et d’en accélérer les

                   2
                                                                                                                                 retombées économiques et sociales.
                             Assurer l’afflux - en quantité et en qualité - d'étudiants locaux et
                             étrangers dans les cycles supérieurs.

                                                                                                                                 Figure 4 : Financement public annoncé pour le développement de l’IA au Québec depuis 2016 (Forum IA Québec, p. 14)

                   3
                              Dresser et maintenir un portrait clair et exhaustif pour l’ensemble des
                              acteurs des besoins, des manques et des possibilités en matière de
                              compétences en sciences numériques.                                                                                                               Subvention fédérale de 93,6 M$ sur 7 ans octroyée par le
                                                                                                                                                    2016                       Fonds d’excellence en recherche Apogée dans le cadre du
                                                                                                                                                                             projet « Données au service des Canadiens » mené par l’IVADO.

                   4         Soutenir les établissements d’enseignement dans l’actualisation
                             de leur offre de formation.
                                                                                                                                                                                  Financement de 25 M$ sur 5 ans octroyé au CRIM par
                                                                                                                                                    2017                           le ministère de l’Économie et de l’Innovation (MESI).

                   5          Promouvoir la littératie mathématique et la démocratisation
                              des sciences.
                                                                                                                                                                                   Octroi d’un budget de 100 M$ sur 5 ans par le MESI
                                                                                                                                                    2017                                dans l’optique d’accélérer et optimiser le
                                                                                                                                                                                   développement de l’écosystème québécois en IA.

                   6
                             Faciliter l’accès à l’information sur les ressources disponibles pour les
                             acteurs de l’écosystème en IA et favoriser leur mise en relation par
                             l’entremise d’une vitrine commune.
                                                                                                                                                                                   Subvention fédérale de 44 M$ au MILA dans le cadre
                                                                                                                                                    2017                          de la stratégie pancanadienne en matière d’IA (CIFAR).

Le développement des compétences en IA et en science des données est donc un prérequis fondamental pour faire face
                                                                                                                                                                             Octroi d’un financement du gouvernement fédéral de 230 M$
à la pénurie de talents, qui devrait s’amplifier. À ce propos, les universités se sont rapidement adaptées à l’évolution des                        2018                  Scale AI, complémenté par 53 M$ du gouvernement provincial (QC).
besoins du marché en offrant de nouveaux programmes menant à l’obtention de diplômes et de certificats en IA, science
des données, mégadonnées et analytique.

16                                                                                                                                                                                                                                                       17
2   DÉFINITION DU DOMAINE DE
         L’INTELLIGENCE NUMÉRIQUE

18                                  19
Note méthodologique                                                                                                            Une technologie habilitante                                     Quatre éléments fondamentaux

                                                                                                                               Les applications de l’IA ont crû substantiellement ces          Plus précisément, les experts interrogés par
                                                                                                                               dernières années (comme dans le transport de marchan-           TECHNOCompétences distinguent quatre éléments
Dans un premier temps, l’équipe projet a mené une série        au plus près la réalité des acteurs de l’industrie de l’IA au
                                                                                                                               dises, la simulation vocale et la reconnaissance visuelle, la   fondamentaux quant à l’IA :
d’entrevues individuelles auprès d’experts de l’industrie      Québec. Les entrevues ont été retranscrites en verbatim
                                                                                                                               prévision météorologique, la calligraphie, les diagnostics
afin de mieux comprendre la réalité et les défis associés      et analysées qualitativement par codification thématique
                                                                                                                               médicaux, la composition musicale, la rédaction de codes         1   Il s’agit d’une science qui permet d’accorder des
à la main-d’œuvre en intelligence artificielle, science        (NVivo).                                                                                                                             capacités de raisonnement humain à
                                                                                                                               logiciels, etc.) et pénètrent progressivement l’ensemble
des données et mégadonnées au Québec. De nature                                                                                                                                                     une machine ;
                                                               Profil des experts en IA : les experts sont majoritairement     des secteurs d’activité. À cet effet, 85 % des solutions d’IA
semi-structurée, ces entrevues d’environ une heure ont
                                                               localisés dans la région de Montréal (66,7 %) et sont princi-   commercialisées seront concrètement appliquées dans              2 Elle utilise des algorithmes comme outils et
permis d’obtenir la définition des concepts à l’étude tels
                                                               palement des hommes (77,8 %). Tous exercent des postes          l’industrie d’ici à 2023 (Gartner, 2020).                            facilitateurs de prises de décision et d’actions ;
que perçus et vécus par les experts. Ces entrevues ont
permis de retracer les différentes étapes de la transforma-    de cadres dans des entreprises qui sont impliquées dans
                                                               l'IA (développement de produits propulsés par l’IA, ser-                                                                         3 Elle touche à l’analyse de données afin
tion numérique (de la création à l’intégration de solutions
                                                               vice-conseil en IA, institut de recherche en IA, etc.).                                                                              de résoudre des problèmes et d’en tirer
d'IA) et d’identifier les différents postes, structures
                                                                                                                                                                                                    des connaissances ;
d’équipes, compétences, connaissances et outils utilisés
par les professionnels en IA pour chacune de ces étapes.                                                                                                                                        4 Il s’agit, dans la majorité des cas,
Cette démarche permet d’offrir une perspective qui reflète                                                                                                                                          d’un outil prédictif.

Définition de l’IA

L’expression « intelligence artificielle » désigne la conception de systèmes informatiques qui sont capables de présenter                          La recherche opérationnelle et la science de
certains attributs de l’intelligence humaine (comme l’apprentissage, la réflexion, la résolution de problème, le raisonne-                         l’aide à la décision (« decision science »)
ment, l’élaboration de stratégies) (Forum IA, 2018). Il existe deux types d’intelligence artificielle :
                                                                                                                                                  L’IA, dans la plupart de ses utilisations, est plus proche de la recherche opération-
                                                                                                                                                  nelle et de la science de la décision que de la robotique. Elles partagent l’emploi de
                                                                                                                                                  techniques issues des sciences mathématiques visant à déterminer des solutions
                                                                                                                                                  telles que la modélisation mathématique, l’analyse statistique et l’optimisation.
            L’intelligence
                                                                                L’intelligence
            artificielle « faible »
                                                                                artificielle « générale »
            qui désigne une machine
            ou un programme capable                                             qui désigne une machine ou un
            d’effectuer une tâche                                               programme capable d’apprendre
            précise potentiellement                                             de multiples tâches et de transférer
            très complexe, mais                                                 ses connaissances d’un problème
            spécialisée, comme jouer                                            à un autre, comme le ferait un
            efficacement au Go ;                                                être humain. À ce jour, seules des
                                                                                formes d’intelligence artificielle
                                                                                « faible » existent, bien qu’elles
                                                                                concernent des tâches de plus en
                                                                                plus complexes.

20                                                                                                                                                                                                                                                       21
Les types d’apprentissage
                                                                                                                                                                                                        Le détecteur de pourriels
L’IA et son développement reposent essentiellement sur                                               Figure 5 : Les algorithmes les plus utilisés (n=75)
trois grandes catégories d’algorithmes d’apprentissage                                                                                                                                                  Utiliser des techniques de programmation traditionnelles pour détecter un pourriel
automatique :                                                                                                                                                                                           reviendrait à coder en dur (« hardcode ») un algorithme de détection pour chacun
                                                                                                            33,33 %                           Méthode de régression                                     des mots suspectés d’être présents dans un pourriel (ex. « vous avez gagné un
 1    L’apprentissage supervisé permet d’inférer des                                                                                          (linéaire, logistique)                                    concours », « gratuit », etc.). En revanche, un même filtre basé sur des techniques
      règles dont la valeur des résultats est connue à                                                      25,33 %                           Arbre de décision (Decision Tree)                         d’apprentissage automatique peut identifier les bons prédicteurs en détectant des
      partir d’exemples bien programmés et définis. Ces                                                                                                                                                 patrons présents dans les données d’observation. Le programme sera plus court,
      exemples permettent à la machine de dévelop-                                                          16,00 %                           Autres algorithmes                                        plus facile à maintenir avec le temps et probablement plus précis.
      per des prédictions dont la précision dépend de                                                       14,67 %                           Autres méthodes d’apprentissage
      la qualité, mais aussi du volume d’entraînement                                                                                         profond (Auto-encoder, Transformer
      de l’algorithme.                                                                                                                        Networks. GANs, RL)

                                                                                                            14,67 %                           Méthode d’apprentissage
 2    L’apprentissage non supervisé permet à la
                                                                                                                                              ensembliste (Random Forest)
      machine de détecter des patrons (« patterns »)
      dans les données de manière autonome. La                                                              13,33 %                           Partitionnement de données
      machine identifie les répétitions dans les données                                                                                      (k-means, hiérarchique)              Les utilisations de l’IA                                            Vers une IA explicative
      (bien souvent disparates et non structurées/éti-                                                      10,67 %                           K plus proches voisins (KNN)
      quetées) et les catégorise en fonction de leurs                                                                                                                              La diffusion de l’IA dans le monde des affaires se caractérise      Cependant, l’IA devient de plus en plus sophistiquée et
                                                                                                            10,67 %                           Réseau de neurones récurrents
      récurrences et similarités.                                                                                                                                                  de plusieurs manières : certaines organisations conçoivent          peut parvenir à des décisions qui proviennent de processus
                                                                                                                                              (RNN)
                                                                                                                                                                                   de l’IA tandis que d’autres intègrent ou utilisent l’IA dans        opaques (problématique de la « boîte noire »). Dans ce cas
 3    L’apprentissage par renforcement repose sur                                                           9,33 %                            Réseau neuronal convolutif (CNN)     les solutions qu’elles proposent à leurs clients. Plus encore,      de figure, l’expertise humaine devient primordiale pour
      l’utilisation d’un dispositif/agent autonome, tel
                                                                                                            8,00 %                            Perceptron multicouche (MLP)         certaines organisations intègrent l’IA dans une démarche            expliquer les comportements et les résultats de la machine.
      un robot, qui apprend à réviser et adapter ses
                                                                                                                                                                                   interne d’optimisation. Certaines grandes entreprises tech-         À cet effet, l’IA explicable (un domaine en expansion de
      actions sur la base d’expériences régies par des                                                      6,67 %                            Approches bayésiennes
                                                                                                                                                                                   nologiques parviennent à regrouper les différents pôles de          l’apprentissage automatique) permet d’évaluer les algo-
      règles d’action au sein d’un environnement fermé.
                                                                                                            6,67 %                            Réseau récurrent à mémoire           la chaine de valeur de l’IA en utilisant l’IA à la fois dans leur   rithmes décisionnels de la boîte noire afin de les rendre
      Les actions de l’agent sont alors renforcées (ou
                                                                                                                                              court et long terme (LSTM)           conception et dans leur organisation interne.                       plus transparents et ainsi mieux comprendre le raisonne-
      récompensées) positivement ou négativement,
                                                                                                            4,00 %                            Réduction de la dimension                                                                                ment de la machine. La traçabilité et la vérifiabilité des
      ce qui lui permet d'adopter au fil du temps les
                                                                                                                                              (PCA, t-SNE)                                                                                             algorithmes décisionnels sont des enjeux majeurs pointés
      comportements décisionnels souhaités (et
                                                                                                                                                                                   Un besoin massif de données                                         par les experts. Sur la base des prédictions Gartner (AI
      souhaitables).
                                                                                                                                                                                                                                                       Business, 2020), tous les professionnels en IA devront
                                                                                                                                                                                                                                                       présenter une expertise en développement responsable
                  Figure 6 : Les cadres d’apprentissage automatique les plus utilisés (n=75)                                                                                       Par-delà leurs spécificités, ces trois grandes catégories
                                                                                                                                                                                                                                                       de l’IA d’ici à 2023.
                                                                                                                                                                                   d’apprentissage automatique requièrent la présence d’une
                           Trois cadres prédominent                                                                                                                                quantité massive d’informations. De plus, la puissance de
                                                                                                                                                                                   calcul et la disponibilité des mégadonnées ont permis
                                                                                                                                                                                   le développement et la sophistication d’algorithmes
                    40 %                                                                                                                                                           qui offrent la possibilité d’aborder des problématiques
                                                                                                                                                                                   complexes qui ne pouvaient être résolues avec des
                    30 %                                                                                                                                                           méthodes traditionnelles. Les algorithmes d’apprentis-
                                                                                                                                                                                   sage profond sont d’autant plus performants qu’ils néces-
                    20 %
                                                                                                                                                                                   sitent une quantité colossale de données. Ces dernières
                    10 %                                                                                                                                                           comprennent très souvent des millions voire des milliards
                                                                                                                                                                                   d’éléments sous-jacents de données, qui eux-mêmes
                    0%                                                                                                                                                             peuvent avoir des milliers de caractéristiques ramifiées
                                                                                                                                                                                   (Davenport, 2018).
                            Scikit-learn

                                           PyTorch

                                                     TensorFlow

                                                                  Autres

                                                                           Xgboost

                                                                                     RandomForest

                                                                                                    Keras

                                                                                                             Fast.ai

                                                                                                                       SparkMLib

                                                                                                                                   LightGBM

                                                                                                                                               Catboost

                                                                                                                                                          H20

                                                                                                                                                                MATLAB

22                                                                                                                                                                                                                                                                                                             23
Les « V » des mégadonnées
                          AlexNet
                                                                                                                                                                                                       Les mégadonnées se définissent par plusieurs caracté-
                      Le 30 septembre 2012, un réseau de neurones convolutif (« convolutional neural network »)                                                                                        ristiques (allant des 3 V jusqu’aux 7 V)3, dont certaines
                      appelé AlexNet a remporté le ImageNet 2012 Challenge avec un taux d’erreur de 10,8 %                                                                                             demeurent centrales :
                      inférieur à celui du finaliste. Cela a été rendu possible grâce à l’utilisation d’unités de traite-
                      ment graphique (« graphic processing unit ») pendant l’entraînement, un ingrédient essentiel

                                                                                                                                                                                                                                   1                                                                2                                         3
                      de la révolution de l’apprentissage profond. Les réseaux sont dorénavant beaucoup plus gros,
                      certains ayant une capacité de 175 milliards de paramètres.

     Figure 7 : Schématisation d’AlexNet
                                                                                                                                                                                                                           Volume                                                           Vélocité                                      Variété
                                                                            3
                                                                                                              3
                                                                                                                                         3                                                                       La quantité de données est                                      Les données sont générées                           Les mégadonnées sont
                                          5                                                                       3
                                              5
                                                                                3                                                            3                                                                  telle que les outils tradition-                                 à une vitesse sans précédent                         souvent de différentes
                                                                                    3
       11
                                     48                                                                 192                        192                 128               2048           2048   Dense            nels de gestion des données                                       depuis différentes sources                        natures (texte, éléments
        11                                                            128
                               55                           27
                                                                                                  13                         13
                                                                                                                                                                                                                  ne suffisent plus pour les                                        numériques (capteurs,                           audio ou vidéos, entrées
                                                                                                                                                 13
                                      5
                                                                                3                                                        3                                                                         stocker et les analyser.                                        communications électro-                         numériques, phénomènes
       224                                5
                                                                                    3                             3
                                                                                                                                             3
                                                                                                                                                                                                                                                                                 niques, etc.), offrant ainsi la                   physiques captés par des
                                                                                                   13                 3       13                  13             Dense          Dense
                                                                 27         3                                                                                                                                                                                                    possibilité d’une analyse en                      capteurs sensoriels, etc.),
             11                                                                 3
             11
                                55
                                                                                                        192                        192                 128
                                                                                                                                                                                                1000
                                                                                                                                                                                                                                                                                temps réel. Les mégadonnées                        peuvent être structurées
                                                                                                                                                              Max
       224                                         Max                                   Max                                                                 Pooling     2048           2048                                                                                    permettent aux organisations                      ou non structurées et pro-
                      Stride
                       of 4
                                                  Pooling                               Pooling                                                                                                                                                                                 d’être agiles dans l’analyse et                  viennent de sources internes
                  3                  48
                                                                                                                                                                                                                                                                                la capture de valeur produite                       et externes. La fusion de
                                                                                                                                                                                                                                                                                       par les données.                           données provenant de dif-
                                                                                                                                                                                                                                                                                                                                   férentes sources reste un
Définition des mégadonnées                                                                                                                                                                                                                                                                                                             procédé complexe.

Les mégadonnées influencent aujourd’hui un grand                                                                          le développement des infrastructures de données. Les
nombre de résultats organisationnels et sociétaux. Par                                                                    mégadonnées sont aussi extrêmement populaires sur les
conséquent, l’intérêt de la communauté d’affaires envers                                                                  réseaux professionnels, avec des milliers de publications                                                                                                                     Le traitement distribué des données
les mégadonnées s’est fortement et rapidement accru.                                                                      LinkedIn écrites sur le sujet (Huselid & Minbaeva, 2018).
L’émergence d’un tel engouement repose sur la crois-
sance exponentielle du nombre de données disponibles                                                                      Les mégadonnées représentent le domaine de l’intelli-                                                                                                                         Si les données sont souvent considérées comme la
et la démocratisation des solutions d’infonuagiques (cloud                                                                gence numérique pour lequel la définition donnée par les                                                                                                                      matière première du XXIe siècle, ce sont les capacités ana-
computing) permettant d’abaisser les coûts de stockage et                                                                 experts interrogés dans cette étude est la plus consen-                                                                                                                       lytiques qui permettent d’en extraire de précieuses pers-
d’hébergement des données. De plus, le développement                                                                      suelle. Ils parlent de mégadonnées lorsqu’il y a un chan-                                                                                                                     pectives. Dans cette optique, les experts qui travaillent
de l’IA et la sophistication des techniques d’apprentissage                                                               gement d’échelle si important dans le volume de données                                                                                                                       avec des mégadonnées utilisent des outils de traite-
automatique facilitent considérablement l’analyse et la                                                                   qu’une machine (ou un ordinateur standard) ne suffit plus                                                                                                                     ment distribué de données, Hadoop et les technologies
conversion des mégadonnées en connaissances à valeur                                                                      pour les stocker et les traiter.                                                                                                                                              MapReduce, Spark et Kafka figurant parmi les principaux.
ajoutée (McKinsey, 2017). Poussés par l’impératif de capter                                                                                                                                                                                                                                             Les applications comme Excel et SPSS ne permettent pas
des données de qualité en temps réel, les entreprises et les                                                                                                                                                                                                                                            de traiter des données volumineuses. Le travail se fait alors
gouvernements investissent des milliards de dollars dans                                                                                                                                                                                                                                                de manière programmatique, soutenu par une infrastruc-
                                                                                                                                                                                                                                                                                                        ture de données où plusieurs parties d’un seul ensemble
                                                                                                                                                                                                                                                                                                        de données peuvent être dispersées sur plusieurs serveurs.

                                                                                                                                                                                                       3
                                                                                                                                                                                                           Les quatre V restants sont la véracité, la variabilité, la valeur et la visualisation.

24                                                                                                                                                                                                                                                                                                                                                                25
Figure 8 : Schématisation d’un traitement distribué de données                                                                               Figure 9 : Les produits d’infonuagiques les plus régulièrement utilisés dans le cadre du travail d’un professionnel
                                                                                                                                                       en intelligence numérique

                                                                                    Fichier 1 Morceau 1

                                                           Serveur 1                Fichier 1 Morceau 2
                                                                                                                                                                                                                      Google Cloud
                                                                                                                                                                                                                       Functions
                                                                                    Fichier 2 Morceau 1
                                                                                                                                                                                                                          12 %
                                                                                    Fichier 1 Morceau 2
                                                                                                               Morceaux redondants                                                                   Google App
                                                                                                          (présents à plusieurs endroits),                IBM Watson                                   Engine
             Application      Shématisation
                                (mapping)
                                                          Serveur 2                 Fichier 1 Morceau 1       prêts à passer à l’action                       7%                                         7%
                                                                                                                en cas de problème                                                                                                Azure
                                                                                    Fichier 2 Morceau 2                                                                                                                         Databricks
                                                                                                                                                                                                                                   12 %
                                                                                                                                                                            AWS S3                              AWS
                                                                                                                                                                                                             Sagemaker

                                                                                                                                                                               29 %
                                                                                    Fichier 1 Morceau 2
                                                                                                                                                      IBM Cloud                                                 7%
                                                                                                                                                         7%                                                                                          Azure Virtual
                                                          Serveur 3                 Fichier 2 Morceau 1
                                                                                                                                                                                                                                                      Machines
                                                                                    Fichier 2 Morceau 2                                                                                                                                                   26 %
                                                                                                                                                                                                      AWS Elastic
                                                                                                                                                                                                                       AWS Elastic
                                              Un même fichier peut être fragmenté                                                                                                                      Beanstalk    Compute Cloud (EC2)
                                               (chunks) dans plusieurs serveurs
                                                                                                                                                       Google Compute
                                                                                                                                                                                                         5%                   19 %
                                                                                                                                                        Engine (GCE)
                                                                                                                                                              14 %
                                                                                                                                                                                     AWS Lambda             AWS EMR                              Databricks
                                                                                                                                                                                          12 %                5%                                    7%
Les services en infonuagique
                                                                                                                                                                                                                       Azure Batch
                                                                                                                                                                                                                           7%
Les entreprises qui adoptent les mégadonnées cherchent                      tions en matière de cybersécurité et de protection des
à développer des infrastructures fiables et flexibles, offrant              données. La notion de gouvernance des données devient                                                                                                         Google AI
une grande disponibilité. De plus en plus, les services en                  un enjeu crucial, confirmé lors des entrevues avec les                             Google Colab                    Azure Container                            Platform
infonuagique semblent être priorisés pour une quantité                      experts. Elles révèlent d’ailleurs les principaux facteurs                               26 %                          Service                                   12 %
de données très importante avec un niveau de sensibi-                       qui orientent le choix des acteurs en matière d’outils de                                                                 17 %
lité modéré. Les principaux services en infonuagique et de                  stockage des données, à savoir :                                                                                                               Google
                                                                                                                                                                                                                         Kubernetes
stockage de données sont, d’après les experts, Amazon                                                                                                                                                                      Engine
Web Services dont Redshift, Microsoft Azure et les                              • Le volume des données ;                                                                                                                   10 %
services de Google, qui peuvent engendrer des coûts très                        • La fréquence d’accès aux données, et ;
importants pour les entreprises. Cela étant, l’externalisa-
tion de la gestion d'une infrastructure informatique réduit                     • Le niveau de sensibilité des données.
les risques financiers associés aux investissements dans
une infrastructure qui peut rapidement ne plus répondre                     À titre d’exemple, imaginons une entreprise en ser-
à la rapidité d’évolution des technologies (Ren et al., 2015).              vice-conseil qui détermine une solution de stockage
                                                                            des données en fonction des besoins de son client. Les
L’infonuagique étant aujourd’hui largement utilisée (les                    données considérées comme très sensibles seraient alors
technologies de traitement distribué des données y sont                     probablement traitées sur des serveurs privés, plus com-
étroitement liées), les experts expriment des préoccupa-                    munément appelés « in house ». (Ren et al., 2015).

26                                                                                                                                                                                                                                                                   27
Vous pouvez aussi lire