Apprentissage et Reconnaisance de Formes Cours 1 Master 1 DAC - Lip6

La page est créée Kévin Gillet

Éducation

Français

Like
Partager
Intégrer
Plein écran
Diapositives
Télécharger HTML
Télécharger PDF
Abus

←

CONTINUER À LIRE

→

Transcription du contenu de la page

Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous

Apprentissage et Reconnaisance de Formes Cours 1 Master 1 DAC - Lip6

Apprentissage et
                          Reconnaisance de Formes
                                  Cours 1

                                       Master 1 DAC

                                          Nicolas Baskiotis

                          nicolas.baskiotis@lip6.fr
                      http://webia.lip6.fr/˜baskiotisn

                          équipe MLIA, Laboratoire d’Informatique de Paris 6 (LIP6)
                                            Sorbonne Université

                                           S2 (2018-2019)

N. Baskiotis (LIP6, SU)                              ARF                               S2 (2018-2019)   1 / 38

Plan

1   Organisation de l’UE

2   Introduction

3   Les problématiques générales

4   Premier exemple : classification de films et arbres de décision

     N. Baskiotis (LIP6, SU)          ARF                      S2 (2018-2019)   2 / 38

Informations administratives
Crénaux
    Cours : Mercredi 16h-18h
    TD/TME :
       I    groupe 1 : Mercredi 8h30-12h45 (Nicolas Baskiotis)
       I    groupe 2 : Jeudi 8h30-12h45 (Sylvain Lamprier)

Supports et références
    Site du master :
    http://dac.lip6.fr/master/enseignement/ues/arf/
    Beaucoup de références on-line, beaucoup de ebooks et de livres, cf site
    en cas de questions/problèmes
      → email : {nicolas.baskiotis, sylvain.lamprier}@lip6.fr
      → Mattermost : channel ARF

Évaluation
    CC :travail en TME, projet et partiel
    Examen
     N. Baskiotis (LIP6, SU)              ARF                     S2 (2018-2019)   3 / 38

Pré-requis

   Mathématiques :
     I    Probabilités et Statistiques
          → Cours MAPSI de M1-S1, Cours 3I005 de L3
     I    Notions d’algèbre linéaire : matrice, vecteur, norme, produit scalaire, . . .
     I    Notions d’analyse : dérivée, dérivée partielle, gradient, intégrale, . . .

   Du formalisme logique :
     I    savoir lire une
                       S formule mathématique :
              ∀x ∈ E F, ∃Y ⊂ Y, p(x) ∈ Y ⇒ ¬q(Y)

   Programmation (pour les TMEs et projet) : Python
     I    savoir faire des scripts (MAPSI)
     I    modules : matplotlib, numpy

   N. Baskiotis (LIP6, SU)                   ARF                               S2 (2018-2019)   4 / 38

Plan

1   Organisation de l’UE

2   Introduction

3   Les problématiques générales

4   Premier exemple : classification de films et arbres de décision

     N. Baskiotis (LIP6, SU)          ARF                      S2 (2018-2019)   5 / 38

Apprentissage artificielle ? (Machine Learning)

A votre avis, ça regroupe quoi ?

     N. Baskiotis (LIP6, SU)        ARF   S2 (2018-2019)   6 / 38

En texte

Classification de documents
E-mails en spam, shopping, travail, . . .

                                                       gmail.com

     N. Baskiotis (LIP6, SU)            ARF   S2 (2018-2019)   7 / 38

En texte toujours

Reconnaissance de chiffres

Ou de captcha                       [Yann et al. 08], Newcastle University

    N. Baskiotis (LIP6, SU)   ARF                  S2 (2018-2019)      8 / 38

Sur des documents
Détection de thèmes (topic detection)

Analyse de 255 discours de l’état de l’union, États-Unis                   [Rule et al, 2014]

Et plein d’autres applications : traduction, détection de plagiat, résumé
automatique, . . .
⇒ U.E. Traitement Automatique du Langage

     N. Baskiotis (LIP6, SU)            ARF                            S2 (2018-2019)      9 / 38

En image
Détection de visages                           (opencv)

Mais aussi ...                       (betafaceapi.com)

     N. Baskiotis (LIP6, SU)   ARF       S2 (2018-2019)   10 / 38

En image
Catégorisation et organisation automatique

    N. Baskiotis (LIP6, SU)       ARF         S2 (2018-2019)   11 / 38

En image
Détection d’objets                              teradeep.com, Purdue University

Tracking                             [Fragkiadaki et al. 12], Pennsylvania University

     N. Baskiotis (LIP6, SU)   ARF                          S2 (2018-2019)      12 / 38

Et l’audio . . .

Reconnaissance de la parole, séparation de sources
http://markus- hauenstein.de

Mais aussi débruitage, transcription musicale, reconnaissance du locuteur,
classification/identification de musiques. . .

       N. Baskiotis (LIP6, SU)        ARF                        S2 (2018-2019)   13 / 38

Interface cerveau-machine (BCI)
Classification d’actions, de pensées

Contrôle

     N. Baskiotis (LIP6, SU)       ARF   S2 (2018-2019)   14 / 38

Objets connectés
Traqueurs d’activité

Surveillance vidéo, monitoring consommation électrique, sécurité
réseau

     N. Baskiotis (LIP6, SU)        ARF                       S2 (2018-2019)   15 / 38

Réseaux sociaux

Détection de communauté, phénomènes de diffusions, classification

    N. Baskiotis (LIP6, SU)        ARF                       S2 (2018-2019)   16 / 38

Matchmaking
de profils, sites de rencontre

Experts, CV - Emplois, Jeux

     N. Baskiotis (LIP6, SU)     ARF   S2 (2018-2019)   17 / 38

Systèmes de recommendation
De musiques, de films, de produits, d’amis

    N. Baskiotis (LIP6, SU)       ARF        S2 (2018-2019)   18 / 38

Et dans d’autres sciences
Biologie IZBI, Leipzig University     Économie

Astronomie                            Climatologie (complétion données)

         N. Baskiotis (LIP6, SU)    ARF                      S2 (2018-2019)   19 / 38

Dans les jeux et la robotique

   N. Baskiotis (LIP6, SU)   ARF   S2 (2018-2019)   20 / 38

L’apprentissage aujourd’hui : Big Data

                                                               extrait du cours d’A. Smola

Entreprises concernées :
Yahoo, Google, Amazon, Netflix, Microsoft, Apple, Xerox, Samsung, Critéo,
Facebook, Twitter, Flicker, Instagram, Reddit, Valve, Steam, Deezer,
Dailymotion, Youtube, SNCF, AXA, EDF, GDF-Suez, Veolia, Safran, Thalès,
les médias, . . .

     N. Baskiotis (LIP6, SU)         ARF                        S2 (2018-2019)       21 / 38

Plan

1   Organisation de l’UE

2   Introduction

3   Les problématiques générales

4   Premier exemple : classification de films et arbres de décision

     N. Baskiotis (LIP6, SU)          ARF                      S2 (2018-2019)   22 / 38

L’apprentissage                               (selon M. Sahani, UCL)
En quelques mots
    Trouver des structures, des régularités dans des observations.
    Prédire de nouvelles observations.

Touche à beaucoup de domaine, interdisciplinarité très forte
    Statistiques : théorie de l’apprentissage, fouille de données, inférence
    Informatique : IA, vision, RI
    Ingénierie : signal, contrôle, robotique
    Science cognitive, psychologie, neuroscience, épistémologie
    Économie : théorie de la décision, théorie des jeux

L’apprentissage artificiel
    étudie les algorithmes qui améliorent leur performance sur une tâche
    donnée en fonction de leur expérience.
    fondements mathématiques, informatiques et applications concrètes des
    systèmes qui apprennent, raisonnent et agissent.
     N. Baskiotis (LIP6, SU)            ARF                            S2 (2018-2019)   23 / 38

Quand appliquer l’apprentissage ?

Lorsque :
   l’expertise humaine est absente
   impossible d’expliquer cette expertise
   les solutions sont dynamiques
   les solutions doivent être adaptées à beaucoup de cas spécifiques
   la taille du problème est trop grand pour que l’humain puisse le résoudre

    N. Baskiotis (LIP6, SU)          ARF                          S2 (2018-2019)   24 / 38

Les grandes familles
Apprentissage supervisé

          Classification                         Complétion de données
          Régression                            Ranking
          Forecasting                            Recommandation

Apprentissage non supervisé
    Clustering
    Apprentissage de représentation, de dictionnaire
    Analyse de séquences
    Représentation hiérarchique
    Détection d’anomalies

Apprentissage par renforcement
    Apprendre à jouer
    Apprendre à interagir avec l’environement
    N. Baskiotis (LIP6, SU)          ARF                          S2 (2018-2019)   25 / 38

Apprentissage supervisé

Données du problème
    Une représentation X des objets de l’étude
    Une sortie d’intérêt y qui peut être numérique, catégorielle, structurée,
    complexe (label, réponse, étiquette, . . . )
    Un ensemble d’exemples, d’échantillons, sous leur représentation X et
    avec leur sortie connue {(x1 , y1 ), . . . , (xn , yn )}

Objectifs
    Prédire de manière précise la sortie y pour un nouvel exemple x non vu
    Comprendre quels facteurs influencent la sortie
    Évaluer la qualité de nos prédictions

    N. Baskiotis (LIP6, SU)              ARF                            S2 (2018-2019)   26 / 38

Apprentissage non supervisé

Données du problème
    Une représentation X des objets de l’étude
    Un ensemble d’exemples, d’échantillons, sous leur représentation X,
    {x1 , . . . , xn }
    Pas de variable de sortie !

Objectifs
    Trouver des groupes d’objets “semblables”
    Organiser les données d’une manière “logique”
    Trouver les “similarités” des objets
    Trouver des “représentations” des objets
 ⇒ on ne sait pas bien ce que l’on cherche
 ⇒ tout un art !

     N. Baskiotis (LIP6, SU)          ARF                        S2 (2018-2019)   27 / 38

Apprentissage par renforcement

Apprentissage continu en fonction du retour d’expérience

Données du problème
    Un état décrit l’environement courant
    Un ensemble d’actions sont possibles
    Une politique permet de choisir en fonction de l’état l’action à effectuer
    A l’issue de chaque action, une récompense est observée

Objectifs
    S’améliorer ! (améliorer la politique de choix de l’action)
    Éviter les situations d’échecs
    Comprendre la dynamique du problème

     N. Baskiotis (LIP6, SU)            ARF                          S2 (2018-2019)   28 / 38

Ce cours
Méthodes jusqu’aux années 2010 !
    Problématiques générales (biais, variance, évaluation, sur-apprentissage,
    représentation des données)
    Algorithmes supervisées (k-nn, bayésien, perceptron, réseaux de
    neurones, svm, . . . )
    Algorithmes non supervisées (hiérarchique, k-means, . . . )
    Pas de méthodes Deep ⇒ en M2 !

Objectifs
    Comprendre les différentes techniques en profondeur,
    principalement algorithmiquement (et un peu théoriquement)
    Comprendre les notions fondamentales de l’apprentissage
    Savoir évaluer une approche
L’apprentissage statistique est au cœur de la formation d’un data scientist

     N. Baskiotis (LIP6, SU)           ARF                          S2 (2018-2019)   29 / 38

Data scientist map                 Chandrasekaran, 2013]

   N. Baskiotis (LIP6, SU)   ARF                           S2 (2018-2019)   30 / 38

Plan

1   Organisation de l’UE

2   Introduction

3   Les problématiques générales

4   Premier exemple : classification de films et arbres de décision

     N. Baskiotis (LIP6, SU)          ARF                      S2 (2018-2019)   31 / 38

Formalisation de l’apprentissage supervisé
On dispose :
    d’un espace de représentation X , usuellement Rn
    n est la dimension de l’espace de représentation,
    chaque dimension = un attribut
    d’un ensemble d’exemples X décrit dans cette espace :
    x ∈ X, x = (x1 , x2 , x3 , . . . , xn )
    d’un ensemble d’étiquettes/labels Y décrivant les classes d’intérêt
    quand Y contient deux classes → classification binaire, usuellement
    Y = {0, 1} ou Y = {−1, 1}
    pour chaque exemple xi de X, son étiquette yi
    ⇒ ensemble d’apprentissage E = {(xi , yi )}

On veut :
Trouver une fonction f : X → Y telle que la prédiction sur de futurs exemples
soit la plus précise possible.

     N. Baskiotis (LIP6, SU)          ARF                          S2 (2018-2019)   32 / 38

Première étape : choix de la représentation

Collection de films, des notes à chaque film

Questions
    Comment représenter un film ?
    Comment classifier ?

     N. Baskiotis (LIP6, SU)         ARF        S2 (2018-2019)   33 / 38

Arbres de décision
                                                                                                                                             budget

Apprentissage d’un arbre de décision
                                                                                                                                             budget

Sélectionner le meilleur attribut

Entropie d’une variable aléatoire
Soit X une variable aléatoire pouvant prendre n valeurs xi :
                                          n
                                          X
                               H(X) = −         P(X = xi )log(P(X = xi ))
                                          i=1

Plus l’entropie est grande, plus le désordre est grand.
Entropie nulle → pas d’aléa.
     N. Baskiotis (LIP6, SU)                       ARF                      S2 (2018-2019)   36 / 38

Sélectionner le meilleur attribut

Entropie d’un échantillon : cas binaire
    X un ensemble de données, Y leur étiquette (positif/négatif)
    p+ la proportion d’exemples positifs
    p− la proportion d’exemples négatifs
    H(Y) = −p+ log(p+ ) − p− log(p− )

Cas général : entropie conditionelle
                     Pn
    H(Y|X = x) = − i=1 P(Y = yi |X = x)logP(Y = yi |X = x)
    Cas binaire :
    H(Y|X = x) = −P(Y = +|X = x)logP(Y = +|X = x) − P(Y = −|X = x)logP(Y = +|X = x)
                      P
    H(Y|X) =              i    P(X = xi )H(Y|X = xi )
 ⇒ Gain d’information : I(X, Y) = H(X) − H(X|Y) = H(Y) − H(Y|X)

     N. Baskiotis (LIP6, SU)                        ARF               S2 (2018-2019)   37 / 38

Où s’arrêter ? Est ce un bon modèle ?

   N. Baskiotis (LIP6, SU)   ARF           S2 (2018-2019)   38 / 38

Vous pouvez aussi lire

APPRENTISSAGE Une insertion professionnelle réussie

APPRENTISSAGE TRANSFRONTALIER EN SARRE-LORRAINE - UN TREMPLIN POUR TON AVENIR Informations pour les jeunes français - Réussir sans ...

Professionnalité de l'assistant/e en pharmacie CFC

Mission : Rétablir l'éducation en 2021 - UNESCO

RESSOURCE HANDICAP FORMATION 2020 - Etoile Region Centre

UNE APPROCHE ÉQUILIBRÉE DE LA LITTÉRATIE - pour mieux enseigner à lire, à écrire, à écouter et à parler - Yukon Education

Réunion régionale sur la production des statistiques en education dans le contexte de la COVID-19 - Institut de statistique de l'UNESCO

Programme de la formation Philippe CAMPIGNION : " Les Chaînes Musculaires et articulaires GDS "

VOS CONTRIBUTIONS À LA FORMATION PROFESSIONNELLE - 2020 MODE D'EMPLOI

Webinaire sur SIMDUT 2015 - Comment percevoir les changements du SIMDUT avec SGH au Québec en 2016 - CITT

Partie 1 : Introduction aux réseaux de Communications - TELECOMMUNICATIONS RESEAUX et

Année 2021 Appel à projet CAF des Hauts-de-Seine - Préfecture des Hauts-de-Seine

STORE MARS AVRIL 2018 - Événements. Actualités. Promotions - LEGO.com

Assurance combinée ménage

Innovations et vieillissement: utopie ou réalité? - Institut et Haute Ecole de la Santé La Source

5 CHANTIERS POUR UNE EUROPE ÉCOLOGIQUE ET SOLIDAIRE - TON VOTE TA PLANÈTE - Réseau Action Climat

3D pour l'archéologie : quelles interactions, pour quoi faire ? - Introspect

Comment innover chaque année pour devenir la meilleure station de ski au monde ? - Nuit de l'Adetem

Cours Méthodes de sondage - Professeur : Claire Durand Département de sociologie, Université de Montréal

CAMPAGNE #TOUJOURSPRESENTS - UPCP

CLAY MATTE PAR AMERICAN CREW - Chalut

École de musique & danse - Skol sonerezh ha dañs Saison Bloavezh 2021 2022

Indice des prix à la consommation : les changements de l'année 2019 - Insee

CNDS 2019 contexte/orientations/organisation - CROS Centre

Mercredi 22 août : Ensemble Calliopée : Duo Magica, Karine Lethiec (alto) et Aude Giuliano (accordéon) Parvis Rainier III - Château - à 21h ...

Enseigner la Technologie au cycle 4 - Inscrire son enseignement dans un cycle - Séminaire 2016 d'accompagnement des programmes de technologie au ...

Rapport d'activités 2018 - SAREPTA Suisse

VILLE CONNECTÉE : PRENEZ LES COMMANDES, SOYEZ SMART ! - La Poste

Skol sonerezh ha dañs - Saison Bloavezh 2020 2021 - Centre Breton d'Art Populaire

Les 800 ans de la Cathédrale Saint-Etienne de Toul - Musicologie.org

Demande d'autorisation pour construction ou transformation

Conception d'un système pour l'emploi du temps universitaire

Météo France Chantier en cours

" Guerres, génocides et violences extrêmes : quels renouvellements ? " - Conférence de M. Yannick Clavé

Votre automate GSM fi able et discret - GD-04 est un automate GSM. Il envoie des SMS, appelle, met en marche, arrête, surveille. Il ne sait pas ...

LE TRIANGLE Parcs et espaces verts - Soirée d'information publique - Ville de Montréal

Participation dans le quotidien de prise en charge : possibilités et limites - Kathrin Brandenberg, Luzia Tinguely 14 octobre 2016

FORMULA UFI DES SOLUTIONS NOVATRICES POUR LES MEDIAS DE FILTRATION - www.ufifilters.com

INTRODUCTION Alexandre Blondin Massé Département d'informatique Université du Québec à Montréal 9 septembre 2015 INF5071 - Infographie - UQAM

PROGRAMMATION SCOLAIRE JEUNE PUBLIC - Écoles maternelles et élémentaires 2017 2018 - 2018 Écoles ...

PRUDENCE AVEC LES FEUX D'ARTIFICE À L'APPROCHE DE LA SAINT-SYLVESTRE - SURVEILLANCE DU MARCHÉ - Portail de la Qualité Luxembourg

Affiche A3 par classe participante au projet.

CINÉPRIM'S LE GOÛT DU CINÉMA POUR LES ENFANTS 2019 - 2020 - Culture & Rencontre

Installer XBMC sur un Raspberry Pi

Biodiversitätsrelevante Fehlanreize - Incitations dommageables à la biodiversité - WSL

Le covoiturage : des pistes pour favoriser son développement - Christophe Saroli Cerema - Direction Technique Territoires et Ville Département ...

FORMATION : APPROCHE DU DOCUMENTAIRE - THÉORIE ET PRATIQUES 20 ET 21 JANVIER 2020 - LA MÉCA, BORDEAUX (33) - ALCA Nouvelle-Aquitaine

LA TERMINALE STG OPTION MERCATIQUE - Sophie Turconi

SÉLECTION DES ÉVÉNEMENTS FNAC CANNES À L'OCCASION DU FESTIVAL DE CANNES 2017 - Groupe Fnac Darty

Tiers Temps Suresnes Automne - Résidence Tiers Temps