Intelligence artificielle développementale - 29 novembre 2018 Olivier Georgeon

La page est créée Emmanuelle Schneider
 
CONTINUER À LIRE
Intelligence artificielle développementale - 29 novembre 2018 Olivier Georgeon
Intelligence artificielle
  développementale

                 29 novembre 2018
            Olivier.georgeon@liris.cnrs.fr
          http://www.oliviergeorgeon.com

           0          10     20   30   40      50
                                               t

                                            1/21
       oliviergeorgeon.com
Intelligence artificielle développementale - 29 novembre 2018 Olivier Georgeon
Organisation
Rendu Projet
  • Rapport Vendredi 9 novembre.
  • Par email olivier.georgeon@liris.cnrs.fr

                                               2/21
                      oliviergeorgeon.com
Intelligence artificielle développementale - 29 novembre 2018 Olivier Georgeon
Séance 3: Objectifs pédagogiques
Après cette séance, vous serez capables
de:
  • Cours
    •    Citer d’autres disciplines scientifiques sources
         d’inspiration pour l’IA développementale
         o Expliquer certains concepts clés apportés par ces disciplines
         o Nommer certaines personnalités qui ont introduit ces
           concepts clés
    •    Définir la notion d’auto-programmation
  • TD
    •    Poser les bases pour concevoir un agent capable
         d’auto-programmation rudimentaire.

                                                                     3/21
                            oliviergeorgeon.com
Idées philosophiques clés pour l’IAD

Implémenter des systèmes sans présupposés
ontologiques. (Kant)
   •   L’agent ne peut pas connaître son environnement « en soi »
   •   Laisser l’agent construire sa propre ontologie de l’environnement
       au fur et à mesure de son expérience d’interaction.
   •   L’agent sais seulement que « s’il fait telle expérience il obtiendra
       tel résultat ».
Sans objectifs prédéfinis (Heidegger)
   •   Mais avec un système de valeur /préférences
Avec une validation par l’usage
   •   Le sens provient de l’usage des connaissances par rapport au
       système de valeur de l’agent (Philosophie pragmatique:
       Wittgenstein, James)

                                                                         4/21
                              oliviergeorgeon.com
Inspirations mathématiques

Théorie du Chaos

Hervé Zwirn

                                     5/21
               oliviergeorgeon.com
Determinisme
Je suis un système déterministe

Je suis un système non déterministe

                                      6/21
                oliviergeorgeon.com
Déterminisme et prédictibilité
Déterministe
  • Chaque état du système découle de manière
    univoque de l’état précédent
  • Si on « ré-exécute » le système, il se
    comportera exactement de la même manière
Prédictibilité
  • Possibilité de prévoir l’état futur d’un système

                                                       7/21
                      oliviergeorgeon.com
Sources d’imprédictibilité
Indéterminisme
  • physique quantique
Incertitude
  • Connaissance imparfaite des lois
  • Connaissance imparfaite des conditions initiales
Complexité
  • Moyens de calcul insuffisants
Irréductibilité computationnelle
  • L’algorithme qui simule le système ne peut pas être
    court-circuité pour prédire directement le résultat à
    l’étape n.
                                                        8/21
                        oliviergeorgeon.com
Imprédictibilité déterministe
Problème des trois corps
  • Résoudre les équations de Newton de N corps
    interagissant gravitationnellement
  • Henri Poincaré
Jeu de la vie de Conway

Fourmi de Langton
  • https://youtu.be/qZRYGxF6D3w

                                                  9/21
                    oliviergeorgeon.com
Fourmi de Langton

                           10/21
     oliviergeorgeon.com
Idées Clés

Un système déterministe peut être
imprédictible.
  •   Inutile d’utiliser la Fonction Random pour générer des
      comportements inattendus.
Un système déterministe peut
« s’individualiser »
  •   En fonction des conditions initiales
  •   En fonction d’expériences individuelles
Emergence de « macro-propriétés »
  •   Impossibles (ou très difficiles) à prouver
  •   Souvent causées par des « interactions circulaires »
  •   Observable par l’expérience

                                                             11/21
                         oliviergeorgeon.com
Psychologie développementale

Apprentissage développemental
  • Jean Piaget (1896 – 1980)
     •   Téléologie / principes motivationnels
     •   La construction du réel chez l’enfant (1937)
          o ”l’individu s'auto-finalise de manière récursive”.
     •   Ne pas séparer perception et action a priori:
          o Notion de schème sensorimoteur

Epistémologie contructiviste
  • Jean-Louis Le Moigne (1931 - )
     •   Les épistémologies constructivistes (1995)
  • Ernst von Glasersfeld.
     •   Constructiviste radical
                                                                 12/21
                           oliviergeorgeon.com
Etapes développementales indicatives

Mois 4: prédictions probabilistes.
Mois 5: modèles des mouvements des mains.
Mois 6: reconnaissance des objets et des visages.
Mois 7: persistance des objets.
Mois 8: modèles dynamiques des objets.

Mois 9: usage d’outils (amène une tasse à la bouche)
         Comportements de pointage d’objets.
Mois 9: premiers mots simples
Mois 10: Imite les mouvements, rampe.
Mois 11: marche avec l’aide d’un adulte.
Mois 15: marche seul.

Le cerveau humain grandit jusqu’à l’age de 25 ans environ
                                                            13/21
                              oliviergeorgeon.com
Idées psychologiques clés pour l’IAD

Raisonner sur les « schèmes
sensorimoteur » plutôt que séparer
perception et action.
Définir un niveau intermédiaire de
l’intelligence:

       Raisonnement et langage               Haut niveau

         Inférences semiotique               Niveau intérmédiaire

      Adaptation stimulus-réponse            Bas niveau

                                                                14/21
                       oliviergeorgeon.com
Apprentissage de régularités hierarchique

                                        Select

                                                        Time
                                      Try to Enact

                                                     15/21
                oliviergeorgeon.com
Pour pratiquer un peu
Little AI: Le jeu où on n'y comprend
rien au départ !

•   App Store Apple

    •   Chercher "Little AI"

•   http://little-ai.com/

•   https://pierreelliott.github.io/LittleAI-
    Web/

                                                     16/21
                               oliviergeorgeon.com
Travaux dirigés 2

                           17/21
     oliviergeorgeon.com
TP2
Deux actions possibles A = {a1,a2}
Deux résultats possibles F = {f1,f2}
Quatre interactions possibles A x F = {i11, i12, i21, i22}
Environnements
    •   env1: a1 -> f1 , a2 -> f2 (i12 et i21 ne se produisent jamais)
    •   env2: a1 -> f2 , a2 -> f1 (i11 et i22 ne se produisent jamais)

Systèmes de valeurs motivationnelles :
    •   valeurs1: v(i11) = v(i12) = 1, v(i21) = v(i22) = -1
    •   valeurs2: v(i11) = v(i12) = -1, v(i21) = v(i22) = 1
    •   valeurs3: v(i11) = v(i21) = 1, v(i12) = v(i22) = -1
Implémenter un agent qui apprenne à effectuer les interactions positives sans
connaître à priori son système de valeur motivationnelles ni son
environnement (env1 ou env2).
                                                                         18/21
                                        oliviergeorgeon.com
Recommendation
•   Class: Valeurs

•   Class: Agent(valeurs)
      •    Méthode: play(feedback) -> action
           •   Implémente le mécanisme décisionnel de l'agent
           •   trace

•   Class: Environnement
      •    Méthode: play(action) -> feedback
           •   Implémente l'environnement

•   Main
      •    Loop
           •   action = Agent.play(feedback)
           •   feedback = Environnement(action)

•
                                                                19/21
                               oliviergeorgeon.com
Analyse de traces d’activité.

  Motivation1,            Motivation1,
  Environnement 1.        Environnement 2.

    a1,f1,1                    a1,f2,-1
    a1,f1,1                    a2,f1,1
    a1,f1,1                    a2,f1,1
    a1,f1,1                    a2,f1,1
    a1,f1,1                    a2,f1,1
    a1,f1,1                    a2,f1,1
    a1,f1,1                    a2,f1,1
    a1,f1,1                    a2,f1,1
    a1,f1,1                    a2,f1,1
    a1,f1,1                    a2,f1,1

                                             20/21
                     oliviergeorgeon.com
Environnement 3
Se comporte comme Environnement1
pendant les 5 premiers cycles, puis
comme environnement2.

Implémentation
  • If (step < 5)
     •   If (action = a1) then feedback = f1
     •   If (action = a2) then feedback = f2
  • Else
     •   If (action = a1) then feedback = f2
     •   If (action = a2) then feedback = f1
  • Step++
                                                21/21
                          oliviergeorgeon.com
Vous pouvez aussi lire