Data Science Master 2 2022-2023
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
Master 2 Sciences, Technologies, Santé 2022-2023 Mathématiques et applications Data Science M2 DS Apprentissage Contrat Pro. PAGE 1
SSOOMMMMAAIIRREE Contacts de la formation 03 Planning de la formation 04 Présentation de la formation 06 Volumes horaires et évaluations 10 Contenu des enseignements Semestre 3 13 Semestre 4 20 Calendriers détaillés 26 PDF interactif pour revenir au sommaire utiliser sur les pages PAGE 2
CONTACTS DE LA FOR MAT I O N Directrice Adjointe à la Pédagogie Sandrine TRAVIER Tél. : 02 41 73 50 01 sandrine.travier@univ-angers.fr M1 Responsable pédagogique et Président du Jury Frédéric PROIA Tél. : 02 41 73 50 47 frederic.proia@univ-angers.fr Bureau : bâtiment I, porte 212 M2 Responsable pédagogique et Président du Jury Fabien PANLOUP Tél. : 02 41 73 50 29 fabien.panloup@univ-angers.fr Bureau : bâtiment I, porte 221 Gestion de la scolarité et des examens Sandrine HERGUAIS Tél. : 02 41 73 54 85 sandrine.herguais@univ-angers.fr Alternance Charlotte BROSSET Tél. : 02 41 73 52 17 re.sciences@contact.univ-angers.fr SCOLARITÉ - EXAMENS Bâtiment A, Rez-de-chaussée Horaires d’ouverture 9h00 – 12h30 13h30 – 17h00 Du lundi au vendredi Fermé le mercredi après-midi PAGE 3
2 0 2 2-2 0 23 N.B. Calendriers détaillés pour les alternants et non-alternants p. 26/27 Premier semestre Rentrée des Alternants Jeudi 01 septembre 2022 Rentrée globale et début des cours Lundi 12 septembre 2022 Vacances d’automne Du samedi 29 octobre 2022 au dimanche 06 novembre 2022 Vacances de Fin d’année Du samedi 17 décembre 2022 au lundi 02 janvier 2023 Fin des cours du 1er semestre Jeudi 12 janvier 2023 Examens 1er semestre l Session 1 Du lundi 16 janvier 2023 au vendredi 20 janvier 2023 Jury 1er semestre l Session 1 Lundi 06 février 2023 Deuxième semestre Début des cours Lundi 23 janvier 2023 Fin des cours du 2ème semestre Vendredi 03 mars 2023 Examens 2ème semestre l Session 1 Du lundi 06 mars 2023 au jeudi 09 mars 2023 Examens 1er semestre l Session 2 Du lundi 06 mars 2023 au jeudi 09 mars 2023 Soutenance de Projet Annuel Vendredi 10 mars 2023 pour les non alternants Vendredi 26 mai 2023 pour les alternants Stage non alternants A partir du lundi 13 mars 2023 Soutenance de Stage / Alternance Du mercredi 30 août 2023 au lundi 04 septembre 2023 Jury 1er semestre l Session 2 Vendredi 29 septembre 2023 Jury 2ème semestre l Session 1 Planning susceptible de modifications PAGE 4
Présentation de la formation PAGE 5
Les mathématiques sont depuis sur le diplôme national de Master longtemps partie prenante du monde mention Mathématiques et Applica- socio-éco- nomique. «L’Étude de tions, parcours Data Science. A l’is- l’impact socio-économique des ma- sue de la formation, le ou la diplô- thématiques en France » (Mai 2015) mé(e) possède : montre une contribution des ma- Des compétences en mathéma- thématiques à hauteur de 15 % du tiques. Le diplômé maîtrise les mé- PIB et 9 % des emplois en France. thodes de l’analyse statistique et al- L’intégration de compétences ma- gorithmique de l’information, qu’elles thématiques est désormais un choix soient classiques (datamining, clas- stratégique du développement d’une sification, ..) ou spécifiques au big entreprise, en France et dans le data (machine learning, ..), ainsi que monde, dans tous les secteurs d’acti- les méthodes associées d’optimisa- vité et particulièrement ceux à forte tion. Le diplômé est en capacité de croissance. modéliser les processus aléatoires, La data Science désigne une dis- de les simuler et de confronter le cipline à l’interface entre modélisa- modèle aux données statistiques du tion mathé- matique, statistique et problème. informatique, née de la nécessité Des compétences en informa- croissante de traiter et d’exploiter les tique. Le diplômé du master dispose données du big data. La data science des compé- tences relatives aux ou- est désormais l’outil essentiel d’aide tils classiques de data management à la décision dans des domaines d’ac- et d’analyse des don- nées (R, Py- tivités extrêmement variés : banque, thon, SQL,..), et plus spécifiques aux finance, assurance, e-commerce et données de grandes dimensions et/ grande distribution, communication ou non structurées : plateforme Ha- et mar- keting, santé, agro-alimen- doop, HDFS, NoSQL, etc... taire, aéronautique et défense, inter- Des aptitudes professionnelles. net des objets et télécoms, etc.. Le diplômé du master sait définir un Le parcours Data Science (DS) du projet, ses objectifs et son contexte, master mention Mathématiques et les modalités de réalisation et d’éva- Appli- cations est une formation de luation des ac- tions, leurs priori- niveau un (Bac+5). Il vise à former tés et leur planning. Il sait utiliser des cadres data-scientists capables les technologies de l’informa- tion de mettre en œuvre les techniques et de la communication, effectuer mathématiques et in- formatiques une recherche d’information à partir inhérentes à ce métier, possédant de sources diverses, organiser une en outre des compétences métiers veille technologique. Il a une bonne propres aux secteurs d’activités visés capacité de communication, une par le choix d’options. bonne maîtrise de l’anglais scienti- fique et technique (certifi- cation), OBJECTIFS, COMPÉTENCES ET et sait rédiger clairement une note CAPACITÉS VISÉS PAR LA ou un rapport selon des supports de FORMATION communication adaptés. Des compétences métiers. Sui- Le master Data Science (DS) est une vant le choix d’option, le diplômé formation en deux ans qui débouche possède des aptitudes spécifiques au PAGE 6
1 traitement et à l’analyse des données Enquête pour les diplômés du master In- de la biologie (don- nées omiques no- génierie Mathématique dont le master DS tamment), ou celles des entreprises est une évolution. Exemples de stages ou d’emplois récents : Renault DI-RC, INRA, dédiées au management du risque iAdvize, CPAM Maine et Loire, LNE, Sodi- ou/et à l’optimisation des actions. france-Netapsys, Atmo Poitou Charentes, Airparif, DAS-MMA, SFR, Ineox, AVISIA, DÉBOUCHÉS VISÉS ET RÉMUNÉ- Metro Cash & Carry France, Tronico groupe RATION DES DIPLÔMÉS Alcen, Imbrikation, Institut de Cancé- rologie de l’Ouest, CHU-Angers, Axens Les diplômés du master Data Science IFP Technologies, Coheris, BRED Banque (DS) occupent des emplois de cadre populaire, Enza Zaden, Institut Gustave Roussy, Groupe PSA, CT Ingénierie, Har- Data scientist (ou Data miner, Data monie Mutuelle, Banque de France, VYV analyst, etc..) couvrant un large Care IT, Capgemini, Sopra-Steria, Sigma spectre de sec- teurs d’activités, tou- Informatique, Socomec SAS,... chant aussi bien au domaine indus- triel qu’à celui du tertiaire. Sont plus PUBLIC VISÉ, PRÉ-REQUIS, particulièrement visés : CONDITIONS D’ADMISSION, — Option données biologiques : sec- teurs de la santé, de la pharmacie, TARIFICATION la bio-in- dustrie, l’agro-industrie, les laboratoires de type Inserm, Cirad, Le master Data Science est à capa- Institut Pasteur, CEA, etc .. cité limitée et l’admission en pre- — Option données numériques : tout mière (M1- DS) et deuxième année secteur tel que sociétés de conseil en (M2-DS) du master est sélective. En ges- tion des entreprises ou spécia- dehors des qualités académiques, le lisées en datamining, de la grande recrutement accorde une part impor- distribution, les grandes banques et tante à la motivation des candidats. compagnies d’assurances, etc.. La validation du M1-DS entraîne L’enquête interne à 12 mois pour la l’admission de droit en M2-DS. promotion 2014-20151 montre une Formation initiale. Le M1-DS excellente insertion professionnelle s’adresse en priorité aux étudiants (90 % en emploi CDI ou CDD) pour diplômés d’une licence de Mathéma- un salaire moyen brut mensuel de tiques, d’une licence de Mathéma- 2 600 Euros (hors primes et 13ème tiques et informatique appli- quées mois). aux sciences humaines et sociales Selon l’APEC, la rémunération des (parcours Mathématiques appli- Data scientists se situe entre 32 et quées), ou d’un niveau équivalent. 40 keuros brut/an en début de car- Sous réserve d’un niveau suffi- rière. sant en mathématique, les dossiers Le master est essentiellement à visée d’étudiants ayant eu un parcours professionnelle. Des possibilités sont plus dirigé vers l’informatique sont cepen- dant offertes aux très bons considérés avec intérêt. Les droits étudiants d’une poursuite d’étude en d’inscription sont fixés par arrêté mi- doctorat par une thèse, en particu- nistériel (droits ministériels : 243 € lier dans le cadre d’une convention en 2022-2023, en M1 et M2). CIFRE avec une entreprise. Formation continue. Les candida- tures relevant de la formation conti- PAGE 7
nue sont les bienvenues et considé- Master DS ont l’assurance de bé- rées avec la plus grande attention. néficier des connaissances et des Les tarifs sont variables et commu- innovations les plus récentes, niqués suite à l’étude du dossier. Un celles à même d’intéresser les en- ensemble de financements est dis- treprises dans leur stratégie compé- ponible (se renseigner auprès de la titive. Direction de la Formation Continue). L’Université d’Angers est reconnue par ses résultats en matière de taux Les pré-requis à l’entrée du M1-DS de réus- site et d’insertion profes- couvrent le programme classique sionnelle de ses 22 700 étudiants d’une Licence de Mathématiques : sur ces deux points, les enquêtes ou tout autre programme européen ministérielles la situent aux toutes ou international équivalent. Outre premières places des universités l’aptitude mathématique, une françaises. Les étudiants du Mas- connaissance et une pratique de ter DS ont l’assurance d’un ac- base d’outils de programmation compagne- ment performant de sont recommandées (Python, Sci- leurs études jusqu’à leur inser- lab, C et/ou R par exemple). L’acquis tion professionnelle. Angers et du certificat C2i-1 d’informatique son agglomération, ville étudiante est apprécié. Le diplôme de master par excellence (plus de 38 000 étu- visant des compétences en anglais diants), apparaît dans les enquêtes certifiées de niveau B2 du CECRL, un nationales comme étant l’une des niveau minimal B1 dans cette langue villes les plus attractives dans ce do- est recommandé à l’entrée du M1- maine : vitalité de la vie étudiante, DS. L’enseignement se faisant es- qualité et modé- ration des prix du sentiellement en français, un niveau logement étudiant, facilité de dépla- minimal B2 certifié en français cement, cadre de vie, etc.. En résu- est exigé des étudiants interna- mé, les étudiants du Master DS tionaux à l’entrée du M1-DS. ont l’assurance d’une qualité de vie et d’étude particulièrement propice à leur réussite et à leur DES RAISONS DE CHOISIR LE insertion professionnelle. MASTER DATA SCIENCE (DS) DE L’UA La qualité de la recherche française en mathématiques fondamentales et appli- quées est mondialement re- connue : suivant les critères choisis, elle se place du premier au troisième rang mondial. Dans ce cadre, la re- cherche en mathématique du labora- toire LAREMA de l’Université d’Angers (62 membres dont 40 perma- nents), associé au CNRS et partenaire du La- bex Lebesgue, se distingue par son excellence. Aussi, les étudiants du PAGE 8
Volumes horaires Évaluations PAGE 9
Master 2 – Data Science .D S SEMESTRE 3 30 ECTS Volum es horaires Contrôle des connaissance s Coef f . ECTS UE Matières Auto. 1 ere s e s s i o n 2e Durée CM TD TP Tot. Et. Assidus D.A. session CT Statistique en Grande Dimension et CT-0,51 1 24 16 16 - 56 6 6 CT1 CT1 3h Apprentissage CC-0,51 Introduction à l'analyse du signal en CT–0,5 2 16 12 8 - 36 4 4 CT CT 2h30 temps discret CC–0,5 Séries Chronologiques et CT–0,5 3 24 12 16 - 52 6 6 CT CT 3h Applications CC–0,5 4 Informatique pour le Big Data 24 0 32 - 56 6 6 CC CT CT 2h30 C ulture d’Entreprise Anglais 0 0 16 - 16 2 2 CC Oral Oral 30mn 5 Communication 0 0 6 - 6 1 1 Oral Oral Oral 1h Métiers - Options au choix 1 parm i 2 Option 1 : Stat. et Science des 16 0 20 - 36 5 5 CC CT CT 2h données pour la biologie I 6 Option 2 : Économétrie de 14 12 0 - 26 5 5 CC CT CT 2h l'Évaluation I 1 Note plancher de 8 à effectuer sur l'UE Conditions de validation du sem estre 3 : Admis·e si moyenne générale > ou= 10 et UE1 > ou= à 8 et UE 4 > ou= à 8 Pas de DA et pas de Session 2 CT = Contrôle Terminal P = Validation en Présentiel Auto. Et. = Autonomie Étudiant CC = Contrôle Continu DA = Dispensé d’Assiduité PAGE 10 18/05/2022 08:58
Master 2 – Data Science .D S SEMESTRE 4 30 ECTS Volum es horaires Contrôle des connaissance s Coef f . ECTS UE Matières Auto. 1 ere s e s s i o n 2e Durée CM TD TP Tot. Et. Assidus D.A. session CT C ulture d’Entreprise Conférences professionnelles et 23 0 0 - 23 0 0 P P P - création d'entreprise 1 3-PE 0 8 0 4 12 0 0 P P P - Projet Annuel Tutoré 0 3 0 53 56 7 7 CC - - - M étiers 1 EC obligatoire + 1 EC d'Option au choix Obligatoire : Traitement d'images 12 0 12 - 24 3 3 CC - - - Option 1 Bio : Stat. et Science des 2 8 0 8 - 16 2 2 CC - - - données en biologie II Option 2 Eco : Économétrie de 14 12 0 - 26 2 2 CC - - - l'Évaluation 2 Choix de 1 parm i 2 entre stage ou alternance Stage Rapport + 3 0 0 0 - 0 18 18 - - - soutenance Alternance Conditions de validation du sem estre 4 : Adm is·e si m oyenne générale > ou=10 et Si Conférences professionnelles validées par la présence C onditions de validation de l’année : Adm is·e si (Sem estre 3 + Sem estre 4) / 2 >ou= 10 et conditions de validation des sem estres 3 et 4 validées Pas de DA et pas de Session 2 CT = Contrôle Terminal P = Validation en Présentiel Auto. Et. = Autonomie Étudiant CC = Contrôle Continu DA = Dispensé d’Assiduité 18/05/2022 08:58 PAGE 11
Contenu des enseignements Les noms des responsables et intervenants sont donnés sous réserve de modifications. PAGE 12
SEMESTRE 3 BLOC MATHÉMATIQUES - UE OBLIGATOIRES vation par l’exemple, théorie du Lasso, UE1 seuillage, sparsité, inégalités classiques, régressions ba- sées sur les composantes STATISTIQUE EN GRANDE principales, PLS). Méthodes de pénalisa- DIMENSION ET APPRENTISSAGE tion (généralisation du Lasso (Elastic-Net, Statistics for Big Data and Machine Group-Lasso), sélection de variables, Learning Ridge, etc.). Classification et apprentis- sage en grande dimension (SVM, Logis- Responsable Fabien Panloup tic-Lasso, forêts aléatoires, k plus proches fabien.panloup@univ-angers.fr voisins, ACP à noyaux, Boosting, Gradient Boosting). Introduction aux réseaux de Pré-requis neurones et au deep learning. Bases de Notions et contenus : Algèbre linéaire et l’optimisation stochastique. Large mise analyse (licence mathématiques L3). Sta- en pratique avec R ou Python. tis- tique inférentielle (S1-UE3-DS). Op- timisation non linéaire (S1-UE2-DS). Da- Compétences tamining et classification (S2-UE1-DS). — Avoir un recul professionnel sur la no- Manipulation standard de R et de Python. tion de grande dimension. Comprendre Compétences et capacités : par l’exemple les raisons théoriques mais — Maîtriser les compétences enseignées aussi les raisons techniques qui différen- dans les modules de statistique inféren- cient les méthodes statistiques classiques tielle et de dataming et classification du des méthodes statistiques en grande di- M1, particulièrement tout ce qui concerne mension. les mo- dèles de régression linéaire et les — Comprendre la théorie du Lasso et méthodes de classification. d’une manière générale la méthodologie — Maîtriser les bases de l’algèbre linéaire, consis- tant à pénaliser une estimation du calcul matriciel, de l’analyse et de l’op- par des contraintes sur les coefficients timisation, en particulier : recherche des de la régression. Avoir une vision claire valeurs propres et singulières, la notion des objectifs visés par les méthodes de de produit scalaire (sur l’exemple de Rn pénalisation (estimation ou sélection de et de L²), les propriétés des espaces de variables). Hilbert de fonctions ou encore l’optimisa- — Savoir réduire la dimension des ob- tion sous contraintes. servations par des méthodes classiques — Maîtriser les notions de loi condition- d’analyse des données (par exemple nelle/espérance conditionnelle. l’ACP) et savoir exploiter cette réduc- — Maîtriser les bases de l’optimisation tion de dimension pour les régressions déterministe (descente de gradient et en grande dimension ou possédant de la exten- sions). multicolinéarité. — Avoir une connaissance minimale des — Savoir ce qui relie et ce qui différen- langages R et Python (syntaxe, manipula- cie le Lasso des méthodes de pénalisa- tion élémentaire, calcul matriciel, gestion tion ba- sées sur des normes différentes des graphiques, etc.). (Elastic-Net, Ridge, etc..). Connaître les points forts et points faibles de chacune Contenus des approches pour en permettre une Bases mathématiques de l’apprentis- mise en pratique per- tinente sur des jeux sage statistique. Bases de la grande di- de données réelles. men- sion (« fléau » de la dimension…). — Connaître les méthodes simples d’ap- Régression en grande dimension (moti- prentissage automatique appliquées à la PAGE 13
classi- fication (comme les k plus proches stabilité des filtres voisins) et les méthodes plus sophis- Problèmes d’aliasing tiquées (comme les forêts aléatoires). Application à des signaux temporels de Avoir une vision d’ensemble de la théorie natures diverses des SVM appliqués à la classification. — Connaître les bases du boosting Compétences (Adaboost/Gradient Boosting, XGBoost). — Maîtriser les calculs de transformation — Comprendre le fonctionnement et sa- de Fourier et de Fourier Inverse. voir mettre en oeuvre un algorithme d’ap- — Savoir tester la stabilité d’un filtre. prentissage par deep learning (perceptron — Savoir concevoir un filtre correspon- et réseaux de neurones convolutionnels). dant à des objectifs donnés — Être capable de mobiliser et exploiter — Savoir utiliser Python et des biblio- les méthodes étudiées dans ce module thèques de type scipy.signal pour mettre dans des cas pratiques sous R ou Python, en pratique la conception des filtres. en particulier les méthodes de régression et de sélection de variables en grande di- Supports ou références mension. — Tisserand, É., Pautex, J. F., & Schweitzer, P. (2009). Analyse et traite- Supports ou références ment des signaux-2e éd.: Méthodes et — Christophe Giraud, Introduction to applications au son et à l’image. Dunod. High-Dimensional Statistics (2015). UE3 UE2 SÉRIES CHRONOLOGIQUES ET INTRODUCTION À L’ANALYSE DU APPLICATIONS SIGNAL EN TEMPS DISCRETS Time Series and Applications Introduction to Discrete-Time Signal Processing Responsable Frédéric Proïa frederic.proia@univ-angers.fr Responsable David Rousseau david.rousseau@univ-angers.fr Pré-requis Notions et contenus : Pré-requis — Bagage mathématique (algèbre, pro- Notions et contenus : espace euclidien, babilités, etc.) de Licence et de Master 1. produit scalaire (licence mathématiqes — Modules de Statistique et de Modèles L3); séries de Fourier (licence mathéma- de régression du M1. tiqes L2). — Manipulation standard de R et de Py- Compétences et capacités : maîtriser le thon. calcul des coefficients d’une série de Fou- Compétences et capacités : rier, la décomposition d’une fonction sur — Savoir manipuler les opérateurs du une base orthogonale ; connaître et sa- calcul des probabilités (espérance, va- voir appliquer le théorème de Parseval et riance, covariance, etc.) appliqué aux va- les inégalités de Bessel ; maîtriser le lan- riables et aux vecteurs aléatoires. gage de programmation Python. — Maîtriser les notions de statistique in- férentielle du S1 et de régression linéaire Contenus du S2. Analyse du signal, motivations, exemples — Maîtriser les bases de l’algèbre linéaire Series de Fourier, Transformée de Fourier et de l’analyse concernant les espaces Filtres FIR (Réponse Impulsionnelle Finie) vectoriels, les produits scalaires et la pro- et IIR (Réponse Impulsion Infinie) – jection orthogonale (sur l’exemple de Rn Impulsion – convolution et de L²). Transformation en Z – Application à la PAGE 14
— Avoir une connaissance minimale des SARIMA (tests de stationnarité, de signi- langages R et Python (syntaxe, manipula- ficativité des paramètres, d’autocorréla- tion élémentaire, gestion des graphiques, tion, etc.). etc.). — Avoir un recul professionnel sur la mo- délisation d’une série, savoir comparer Contenus plusieurs approches sur la base de cri- Décomposition des séries chronologiques tères adaptés aux objectifs de l’étude. (modèles additif et multiplicatif, filtrage — Être capable de mobiliser toutes ces linéaire). Processus aléatoires discrets compétences dans des cas pratiques avec (bruit blanc, loi d’un processus, espace R et Python. L²). Stationnarité (sens fort, sens faible). — Connaître les rudiments de la statis- Processus linéaires (opérateurs chrono- tique spatiale par l’intermédiaire du kri- logiques, bruit d’innovation, causalité, geage. ACF/PACF). Étude détaillée des proces- sus ARMA. Inférence dans les processus Supports ou références ARMA. Introduction à la non-stationnarité — P. Brockwell, R. Davis. Time Series: (ARIMA-SARIMA) et à l’hétéroscédasticité Theory and Methods. Seconde édition. (ARCH-GARCH). Application à la prévision Springer Series in Statistics, 1991. (meilleur prédicteur linéaire, lissages ex- ponentiels). Introduction à la statistique spatiale (krigeage). Large mise en pra- tique avec R et Python. Compétences — Être capable de reconnaître visuelle- ment une série à composantes additives ou multiplicatives, avec tendance et/ou périodicité, et d’éliminer les tendances par un filtrage approprié. — Savoir étudier la stationnarité d’un processus discret et savoir la tester en pratique. Comprendre la différence entre stationnarité forte et stationnarité au se- cond ordre. — Savoir calculer la fonction d’autocorré- lation d’un processus stationnaire. Savoir construire son autocorrélation partielle par un algorithme approprié. — Acquérir une approche théorique so- lide d’un processus ARMA. Savoir établir des conditions sur ses paramètres per- mettant d’étudier ses propriétés. — Savoir estimer l’ACF et la PACF d’une série chronologique stationnaire, en pro- poser une modélisation ARMA adaptée par comparaison avec le comportement théorique des autocorrélations. — Savoir étendre la définition des pro- cessus ARMA aux processus ARIMA, SA- RIMA, ARCH et GARCH ainsi que leur mise en pratique. — Connaître les principaux tests d’hypo- thèses adaptés au cadre ARMA/ARIMA/ PAGE 15
BLOC OUTILS NUMÉRIQUES ET INFORMATIQUE - UE OBLIGATOIRE tion ou déploiement d’un modèle de Ma- UE4 chine Learning. — Aspects techniques d’un déploiement. INFORMATIQUE POUR LE BIG DATA — Mise en pratique : déploiement d’une Big Data API Web avec Flask. Responsable Jacquelin Charbonnel — Maintenance post-déploiement : log- jacquelin.charbonnel@univ-angers. ging, model drift, qualité des données. fr — Prérequis d’un déploiement réussi : intervenants Marie Badreau l Mohamed versionnage, tests unitaires, bonnes pra- Benzarga l Jacquelin Charbonnel l David tiques de code, etc. Rousseau — Vue d’ensemble des métiers et logiciels liés au MLOps. Pré-requis Compétences Notions et contenus : Bases de données — Comprendre les concepts et l’apport du relationnelles (S2-UE4-DS). Programma- Big Data par rapport aux enjeux métiers. tion (S1-UE5-DS). Statistique (S2-UE1- — Comprendre l’écosystème technolo- DS). gique nécessaire pour réaliser un projet Compétences et capacités : Connais- Big Data. sances de base des modèles relationnels. — Acquérir les compétences techniques Connaissances en statistique et des lan- pour gérer des flux de données com- gages de programmation. plexes, non structurés et massifs. — Visualisation d’espaces latents, implé- Contenus menter des modèles d’analyses statis- Concepts et les enjeux du Big Data tiques pour répondre aux besoins métiers. Technologies du Big Data : — Comprendre l’intérêt du déploiement — Architecture et composants de la plate- d’un modèle de Machine Learning forme Hadoop. — Avoir une vue d’ensemble des points — Modes de stockage (NoSQL, HDFS). d’attention d’une mise en production, — Principes de fonctionnement de MapRe- avant, pendant et après sa réalisation duce. — Acquérir une compétence technique de — Programmation concurrente (généra- base pour créer une API Web avec Flask teurs, multi-threading, multi-processing, ; mettre en pratique quelques aspects du asynchronisme). MLOps. — Web services. — Nase de data visualisation. Gérer les données structurées et non structurées : — Principes de fonctionnement HDFS. — Importer des données externes vers HDFS. — Réaliser des requêtes SQL avec HIVE. — Utiliser PIG pour traiter la donnée. Les méthodes d’analyse des données pour le Big Data (en liaison avec S3-UE1-DS) : — Les méthodes d’exploration. — Segmentation et classification. — Estimation et prédiction. — Implémentation des modèles. — Méthodes de réduction de dimensions. Introduction au MLOps : Mise en produc- PAGE 16
BLOC CULTURE D’ENTREPRISE - UE OBLIGATOIRES claire et détaillée sur une grande gamme UE5 de sujets, émettre un avis sur un sujet d’actualité et exposer les avantages et ANGLAIS les inconvénients de différentes possibi- English lités. » Responsable Philippe Torrès philippe.torres@univ-angers.fr UE5 Intervenant Bruno Menan bruno.menan@univ-angers.fr COMMUNICATION – PRÉPARATION À L’INSERTION PROFESSIONNELLE Pré-requis Communication – Professional Integra- Notions et contenus : Les bases de la tion Program langue anglaise. Compétences et capacités : Maîtriser le Responsable Fabien Panloup niveau B1 du CECRL (dit « d’utilisateur fabien.panloup@univ-angers.fr indépendant »). Intervenants Intervenants du SUIO-IP et/ou autres intervenants professionnels Contenus —Permettre aux étudiants de continuer à Pré-requis travailler les cinq compétences en langue Compétences de l’UE S2-UE5 communi- - compréhension écrite et orale, expres- cation. sion écrite et orale, et interaction orale - à travers des supports authentiques (ar- Contenus ticles, documentaires, documents audio —Techniques de communication - Pré- et vidéo d’internet, graphiques…) et des paration au travail en groupe : Les activités variées (exercices de compré- fonctions de l’animateur ; Conduite de hension, d’expression écrite, jeux de rôle, réunions - Techniques de rédaction des débats, présentations orales…). documents — Techniques de présenta- — Etoffer les connaissances lexicales. tion orale - La recherche d’emploi : — Améliorer la prononciation et revoir Lettres de candidature ; Curriculum certains points de langue le cas échéant. vitae ; Entretien de candidature. —Valider à l’issue du 3ème semestre un niveau B2 du CECRL (par le biais d’une certification). Compétences On vise, à l’issue du 2ème voire 3ème semestre du Master, le niveau de com- pétence B2 du Cadre Européen Commun de Référence pour les Langues (CECRL) qui est résumé comme suit : « Peut com- prendre le contenu essentiel de sujets concrets ou abstraits dans un texte com- plexe, y compris une discussion technique dans sa spécialité. Peut communiquer avec un degré de spontanéité et d’aisance tel qu’une conversation avec un locuteur natif ne comporte de tension ni pour l’un ni pour l’autre. Peut s’exprimer de façon PAGE 17
BLOC MÉTIERS - UE OPTIONNELLES (UN CHOIX SUR DEUX) rémission puis de guérison d’un patient UE6 peut être trop long et donc jamais obser- vé, on parle alors de données censurées. OPTION 1 Dans ce cours, nous introduirons la mé- thodologie (fonction de survie, risque ins- STATISTIQUE ET SCIENCE DES tantané, …) et les outils statistiques (es- DONNÉES POUR LA BIOLOGIE I timateur de Kaplan-Meier, Nelson-Aalen, …) qui permettent d’appréhender ce Responsable Mikael Escobar-Bach genre de problèmes. Une implémenta- mikael.escobar-bach@univ-angers.fr tion sur R sera aussi proposée. Intervenants Jérémy Clotault l Mikael Escobar-Bach l Frédéric Proia Introduction aux plans d’expérience jeremmy.clotault@univ-angers.fr Introduction to Design of Experiments frederic.proia@univ-angers.fr Responsable Mikael Escobar-Bach Pré-requis mikael.escobar-bach@univ-angers.fr Notions et contenus : Les plans d’expérience forment un outil - Cours de Introduction à la génomique, essentiel en statistique expérimentale, ils Statistique et Modèles de régression du permettent d’esquisser les contours d’une M1. méthodologie et d’organiser au mieux la - Compétences en R et/ou Python. suite des mesures à effectuer afin de ré- Compétences et capacités : Maîtriser les pondre à une problématique statistique concepts généraux des probabilités, des donnée. statistiques et des modèles de régression Nous décrirons de manière succincte vus en M1, ainsi que l’introduction à la quelques plans d’expérience classique- génomique. ment utilisés dans les sciences du vivant. Contenus Modèles de reconstruction de généa- Cet enseignement, divisé en trois par- logie ties respectivement intitulée Introduction Probabilistic reconstruction of genealo- à l’Analyse de Survie, Introduction aux gies plans d’expériences et Modèles de re- construction de généalogie , a pour objec- Responsable Jérémy Clotault tif de présenter quelques thèmes impor- jeremy.clotault@univ-angers.fr tants de Statistique et Modélisation pour la biologie. Ci-dessous une description Ce module est dédié à l’étude d’un cas plus précise. pratique de reconstruction généalogique dans une population végétale. Après Introduction à l’Analyse de Survie quelques concepts génétiques généraux Introduction to Survival Data Analysis liés aux ni- veaux de ploïdie, à la pro- duction des gamètes et aux croisements, Responsable Mikael Escobar-Bach nous proposerons un modèle permettant mikael.escobar-bach@univ-angers.fr de reconstruire, à partir de marqueurs génétiques, un ensemble d’arbres généa- Le problème des données manquantes logiques probabilisés dans une population est fréquemment rencontré dans un végétale soumise à des lois de repro- grand nombre de domaines d’applications duction spécifiques. Nous étudierons des statistiques. Dans le cadre de la biologie, reconstructions dans des populations di- il n’est pas rare que l’acquisition de don- ploïdes ou tétraploïdes, et un travail pra- nées de suivi soit en partie incomplète : tique sera demandé dans le cas diploïde. pour un essai thérapeutique, le temps de Une partie de ce travail sera dédiée à la PAGE 18
programmation effective de la recons- 9- Chapitre VIII : Arbres de décision et truction généalogique en R ou en Python. Nested logit La visualisation des résultats sera réalisée Compétences : à l’aide du package igraph de R ou de son On expose les méthodes d’estimations équivalent en Python. d’un modèle non linéaire dans la variable endogène. Cas de choix discrets dicho- Compétences tomiques et polytomiques, modèles de Logit-Probit-Tobit-Modèles de Heckman. comptage et des observations censurées. Choix discrets/ Les modèles de choix bi- naire (probit)/modèle Logit/modèle Logit Contenus multinomial/modèle Logit conditionnel/ Modèles Logit-Probit-Tobit. Arbres de de- modèles à choix ordon-nés/modèles de cision et Nested Logit. comptage/modèles à variables limitées Compétences (tron-quées)/mo- dèles d’autosélection/ Applications sur données réelles macroé- Arbres de décision et Nested Logit. Vi- conomiques et microéconomiques. sualisation de graphes. Arbres probabili- sés. Principe des plans d’expérience. Supports ou références — Greene-Maddala-Train-Thomas Supports ou références — Analysis of Survival Data by D.R. Cox, David Oakes, 1984 by Chapman and Hall/CRC. — Le modèle linéaire par l’exemple, JM. Azaïs et JM. Bardet, Dunod, Paris, 2005. UE6 OPTION 2 ÉCONOMÉTRIE DE L’ÉVALUATION 1 Econometric Techniques 1 Responsable Philippe Compaire philippe .compaire@univ-angers.fr Pré-requis Cours d’économétrie niveau L3 Notions et contenus : 1- Introduction 2- Chapitre I : Les modèles de choix bi- naires (probit) 3- Chapitre II : Le modèle logit 4- Chapitre III : Le modèle logit multi- nomial 5- Chapitre IV : Le modèle logit condi- tionnel 6- Chapitre V : Les modèles à choix or- donnés 7- Chapitre VI : Les modèles de comptage 8- Chapitre VII : Les modèles à variables limitées (tronquées) PAGE 19
SEMESTRE 4 BLOC CULTURE D’ENTREPRISE - UE OBLIGATOIRES réalisé et un calendrier sera défini pour UE1 la réalisation. La seconde phase du projet consistera au traitement du problème en CRÉATION D’ENTREPRISE - utilisant les concepts, méthodes et outils PRÉPARATION À L’INSERTION appropriés et satisfaisants au cahier des PROFESSIONNELLE charges. Le projet annuel met en oeuvre l’ensemble des compétences théoriques Responsable Fabien Panloupl et pratiques du master, sur un thème en fabien.panloup@univ-angers.fr lien avec l’option métier. Intervenants SUIO-IP Compétences Contenus — Autonomie. L’enseignement dédié à la création d’en- — Capacité à travailler en équipe. treprise vise à fournir aux étudiants les — Capacité à mettre en oeuvre les conte- éléments méthodologiques nécessaires. nus du master. Il s’appuiera sur l’intervention de profes- — Capacité à rédiger un rapport. sionnels et sollicitera un travail personnel — Capacité à réaliser une soutenance. des étudiants sous forme de capsule. — Capacité créative et de recherche. Conférences Professionnelles Responsable Fabien Panloup fabien.panloup@univ-angers.fr Intervenants Extérieurs Contenus Des exposés et des mini-cours seront proposés par des professionnels à la fois pour présenter le métier de data scientist mais aussi pour compléter la formation par des introductions à des thèmes de développement souvent récents. Projet Annuel Tutoré Annual Training Project Responsable Fabien Panloup fabien.panloup@univ-angers.fr Contenus Les étudiants réalisent en groupe un pro- jet annuel entre septembre et février avec une soutenance à mi-projet, sous l’enca- drement d’un tuteur enseignant. La réali- sation du projet s’efforcera de calquer le déroulement de la gestion de projets dans le monde socio-économique. Dans une première phase, après avoir circonscrit le problème, un cahier des charges sera PAGE 20
BLOC MÉTIERS - UE OBLIGATOIRES UE2 TRAITEMENT D’IMAGES Responsable David Rousseau david.rousseau@univ-angers.fr Pré-requis Notions et contenus : - Contenus des cours de - -S3-M2 DS « Statistique en Grande Dimension et Apprentissage » et « Bases de Données Avancées-Big Data ». Compétences : - Traitement des données avec Python. - Bases sur les réseaux de neurones. Contenus Cet enseignement a pour objectif d’intro- duire les concepts principaux du traite- ment d’images pour les mettre en oeuvre via des outils logiciels libres standards (Scikit image Python, imageJ, Illastik, Knime, ...) sur des questions variées. A l’issue du cours, les étudiants devront être capables de construire un «pipeline» de traitement d’images pour réaliser de l’apprentissage machine basé expert ou par réseau de neurones profonds. Supports ou références — Peters, J., Janzing, D., & Schölkopf, B. (2017). Elements of causal inference: foundations and learning algorithms (p. 288). The MIT Press. — Ramsundar, B., Eastman, P., Walters, P., & Pande, V. (2019). Deep learning for the life sciences: applying deep learning to genomics, microscopy, drug discove- ry, and more. O’Reilly Media. PAGE 21
UE OPTIONNELLES (UN CHOIX SUR DEUX) to genomics, microscopy, drug discove- UE2 ry, and more. O’Reilly Media. OPTION 1 Bio UE2 STATISTIQUE ET SCIENCES DES DONNÉES POUR LA BIOLOGIE II OPTION 2 Eco Responsable Olivier Goudet olivier.goudet@univ-angers.fr ECONOMÉTRIE DE L’EVALUATION 2 Econometric Techniques 2 Pré-requis Notions et contenus : Responsable Christophe Daniel — Contenu du cours S2-M1 DS « Intro- christophe.daniel@univ-angers.fr duction à la génomique ». Pré-requis — Contenus des cours de S3-M2 DS Notions, contenus det compétences : « Statistique en Grande Dimension et — Modèles micro-économiques du tra- Apprentissage » et « Bases de Données vail-Econométrie des données transver- Avancées-Big Data ». sales et de panel. Compétences : — Traitement des données avec Python. Contenus — Modèles de régression multivariée. 1 Théories microéconomiques : — Modèles graphiques. — Des inégalités et des discriminations (hommes-femmes). Contenus — De l’éducation (rendements de l’édu- Cet enseignement se focalise principa- cation ou de l’expérience), négociations lement sur l’inférence de réseaux et la collectives. transcriptomique. Il a pour objectif de — Du choix des conditions de travail renforcer les compétences en analyse de (théories des différences compensatrices, données génomiques et d’introduire les de la segmentation, et des salaires hédo- réseaux biologiques. niques). Cet enseignement sera dispensé sous — De la satisfaction au travail. forme de CM et de TP de mise en pra- 2 Passage des modèles théoriques aux tique sur des données réelles. La réalisa- modèles économétriques : fonctions de tion d’un projet de traitement de données gains (Mincer, élargies aux conditions de transcripto- miques et d’inférence de ré- travail…), équation de choix des condi- seaux sera proposée à l’issue du cours. tions de travail, biais d’endogénéité et de sélection, méthodes de correction Compétences (Variables instrumentales et méthode Introduction aux réseaux biologiques l d’Heckman de l’Inverse du Ratio de Mill), Méthodes d’inférences de réseaux l Cau- modèle à deux régimes, décomposition salité l Méthode de validation. de Blinder-Oaxacca, de Machado-Mata, indices de satisfaction… Supports ou références 3 Applications sur données transversales — Peters, J., Janzing, D., & Schölkopf, : estimations et tests B. (2017). Elements of causal inference: Méthodes d’estimation : MCO, Moindres foundations and learning algorithms (p. Carrés Pondérés, Moindres Carrés Gé- 288). The MIT Press. néralisés, probit et logit (odd-ratios, — Ramsundar, B., Eastman, P., Walters, modèles simples ou bivariés), Variables P., & Pande, V. (2019). Deep learning for instrumentales, Heckman, estimation par the life sciences: applying deep learning quantiles, Principal Component Regres- PAGE 22
sion et Partial Least Squares. 4 Évaluations contrefactuelles des poli- tiques publiques de l’emploi : Approche expérimentale (groupe test, groupe de contrôle), différences-en-diffé- rences, score de propension, bootstrap… PAGE 23
BLOC STAGE OU ALTERNANCE UE3 STAGE OU ALTERNANCE Stage de 5 à 6 mois en entreprise ou alternance sur l’année PAGE 24
Calendriers 2022 2023 PAGE 25
CALENDRIER DÉTAILLÉ 2022-2023 FORMATION INITIALE/ALTERNANTS Semaines # Début Fin Formation Alternance initiale 35-36 2 29/08/2022 9/09/2022 Entreprise 37-43 6 12/09/2022 28/10/2022 Enseignement S3 Enseignement S3 44-46 3 31/10/2022 18/11/2022 Projet annuel Entreprise 47-50 4 21/11/2022 16/12/2022 Enseignement S3 Enseignement S3 51-52 2 19/12/2022 30/12/2022 Vacances Entreprise 1 1 02/01/2023 06/01/2023 Projet annuel Entreprise 2 1 09/01/2023 13/01/2023 Enseignement S3 Enseignement S3 3 1 16/01/2023 20/01/2023 Examens S3 Examens S3 4-5-6 3 23/01/2023 10/02/2023 Enseignement S4 Enseignement S4 7-8 2 13/02/2023 24/02/2023 Projet annuel Entreprise Enseignement S4 Enseignement S4 9-10 2 27/02/2023 9/03/2023 S4 Examen S1 S4 Examen S1 Session 2 Session 2 Soutenance 10 10/03/2023 10/03/2023 Projet annuel 11-18 8 13/03/2023 5/05/2023 Stage Entreprise Projet annuel + 19-21 3 09/05/2023 26/05/2023 Stage Soutenance 22-34 12,5 23/05/2023 27/08/2023 Stage Entreprise 35 0,5 30/08/2023 04/09/2023 Soutenance Stage Soutenance Stage PAGE 26
Master 2 Data Science 2022 2023 Ao û t Sep t . Oc t . No v . Déc . J an v i er Fév r i er Mar s Av r i l Mai Juin J u i l l et Ao û t Sep t . M A M A M A M A M A M A M A M A M A M A M A M A M A M A 1 L 1 J 1 S 1 M 1 J 1 D 1 M 1 M 1 S 1 L 1 J 1 S 1 M 1 V 2 M 2 V 2 D 2 M 2 V 2 L 2 J 2 J 2 D 2 M 2 V 2 D 2 M 2 S 22 3 M 3 S 3 L 3 J 3 S 3 M 5 3 V 3 V 3 L 3 M 3 S 3 L 3 J 3 D 44 31 31 4 J 4 D 4 M 4 V 4 D 4 M 4 S 4 S 4 M 18 4 J 4 D 4 M 4 V 4 L 5 V 5 L 5 M 5 S 5 L 1 5 J 5 D 5 D 5 M 5 V 5 L 5 M 5 S 5 M 6 S 6 M 40 6 J 6 D 6 M 6 V 6 L 6 L 14 6 J 6 S 6 M 27 6 J 6 D 6 M 7 D 7 M 7 V 7 L 7 M 7 S 7 M 7 M 7 V 7 D 7 M 7 V 7 L 36 7 J 8 L 36 8 J 8 S 8 M 49 8 J 8 D 8 M 8 M 8 S 8 L 23 8 J 8 S 8 M 8 V 9 M 9 V 9 D 9 M 9 V 9 L 6 9 J 10 9 J 9 D 9 M 9 V 9 D 9 M 9 S 10 M 10 S 10 L 45 10 J 10 S 10 M 10 V 10 V 10 L 10 M 10 S 10 L 32 10 J 10 D 32 11 J 11 D 11 M 11 V 11 D 11 M 11 S 11 S 11 M 19 11 J 11 D 11 M 11 V 11 L 12 V 12 L 12 M 12 S 12 L 2 12 J 12 D 12 D 12 M 12 V 12 L 12 M 12 S 12 M 13 S 13 M 41 13 J 13 D 13 M 13 V 13 L 13 L 15 13 J 13 S 13 M 28 13 J 13 D 13 M 14 D 14 M 14 V 14 L 14 M 14 S 14 M 14 M 14 V 14 D 14 M 14 V 14 L 37 14 J 15 L 37 15 J 15 S 15 M 50 15 J 15 D 15 M 15 M 15 S 15 L 24 15 J 15 S 15 M 15 V 16 M 16 V 16 D 16 M 16 V 16 L 7 16 J 11 16 J 16 D 16 M 16 V 16 D 16 M 16 S 17 M 17 S 17 L 46 17 J 17 S 17 M 17 V 17 V 17 L 17 M 17 S 17 L 33 17 J 17 D 33 18 J 18 D 18 M 18 V 18 D 18 M 18 S 18 S 18 M 20 18 J 18 D 18 M 18 V 18 L 19 V 19 L 19 M 19 S 19 L 3 19 J 19 D 19 D 19 M 19 V 19 L 19 M 19 S 19 M 20 S 20 M 42 20 J 20 D 20 M 20 V 20 L 20 L 16 20 J 20 S 20 M 29 20 J 20 D 20 M 21 D 21 M 21 V 21 L 21 M 21 S 21 M 21 M 21 V 21 D 21 M 21 V 21 L 38 21 J 22 L 38 22 J 22 S 22 M 51 22 J 22 D 22 M 22 M 22 S 22 L 25 22 J 22 S 22 M 22 V 23 M 23 V 23 D 23 M 23 V 23 L 8 23 J 12 23 J 23 D 23 M 23 V 23 D 23 M 23 S 24 M 24 S 24 L 47 24 J 24 S 24 M 24 V 24 V 24 L 24 M 24 S 24 L 34 24 J 24 D 34 25 J 25 D 25 M 25 V 25 D 25 M 25 S 25 S 25 M 21 25 J 25 D 25 M 25 V 25 L 26 V 26 L 26 M 26 S 26 L 4 26 J 26 D 26 D 26 M 26 V 26 L 26 M 26 S 26 M 27 S 27 M 43 27 J 27 D 27 M 27 V 27 L 27 L 17 27 J 27 S 27 M 30 27 J 27 D 27 M 9 39 28 D 39 28 M 28 V 28 L 28 M 28 S 28 M 28 M 28 V 28 D 26 28 M 28 V 28 L 28 J 52 29 L 29 J 29 S 48 29 M 29 J 29 D 13 29 M 29 S 29 L 29 J 29 S 29 M 29 V 35 35 30 M 30 V 30 D 30 M 30 V 30 L 30 J 30 D 22 30 M 30 V 30 D 30 M 30 S 31 M 31 L 31 S 31 M 31 V 31 M 31 L 31 J F o r m a t i o n à l ' Un i v e r s i t é So u t e n a n c e s J o u r s f ér i és Volume horaire de cours : 356 H Volume horaire de projet tutoré émargé : 56 H Ré v i s i o n s e t Ex a m e n s Volume horaire total des heures émargées : 402 H M A Mat i n /Ap r ès -m i d i D CALENDRIER ALTERNANCE (CONTRAT PRO OU APPRENTISSAGE) é Volume horaire de projet tutoré non émargé : 326 H Pé r i o d e s e n e n t r e p r i s e Week -en d m ar Date de la rentrée universitaire : jeudi 1er septembre 2022 ra PAGE 27
Parking Personnels Parking Personnels Entrée Entrée et sortie et sortie piétons Véhicules 4 Boulevard de Lavoisier BÂT. Entrée L BÂT. et sortie Piétons F BÂT. BÂT. BÂT. G i E BÂT. H BÂT. C’ K LA BÂT. SERRE BÂT. BÂT. J C Entrée et BÂT. sortie Piétons B B’ DA GAZ BÂT. BÂT. BÂT. P3 BÂT. A Entrée et sortie Véhicules BÂT. o D BÂT. M N 2 Boulevard ACCUEIL DB BÂT. BÂT. NO s de Lavoisier E Parking Personnels Impression Service Reprographie UA A Administration ı Scolarité ı Enseignement (Amphi A à E) B Biologie végétale ı Physiologie végétale ı Travaux pratiques biologie B’ Travaux pratiques biologie C Travaux pratiques chimie C’ Département de Géologie ı Recherche environnement (LETG -LEESA) ı Recherche géologie (LPGN-BIAF) D Travaux pratiques physique Da Enseignement ı Travaux pratiques physique Db Département de Physique ı Recherche physique (LPHIA) E Travaux pratiques biologie F Département de Biologie ı Recherche neurophysiologie (SIFCIR) ı Travaux pratiques biologie, géologie GH Département Informatique ı Recherche Informatique (LERIA) ı Travaux pratiques géologie I Département Mathématiques ı Recherche Mathématiques (LAREMA) J Chimie enseignement ı Travaux pratiques K Département de Chimie ı Recherche Chimie (MOLTECH Anjou) L Espace multimédia ı Enseignement (Amphi L001 à L006) ı Salle d’examen rez-de-jardin 2, Boulevard Lavoisier 49045 ANGERS CEDEX 01 T.0241735353 PAGE 28 www.univ-angers.fr
Vous pouvez aussi lire