Intelligence artificielle développementale - 28 octobre 2019 Olivier Georgeon

La page est créée Amandine Maurice
 
CONTINUER À LIRE
Intelligence artificielle développementale - 28 octobre 2019 Olivier Georgeon
Intelligence artificielle
  développementale

                   28 octobre 2019
            Olivier.georgeon@liris.cnrs.fr
          http://www.oliviergeorgeon.com

           0          10     20   30   40          50
                                               t

                                            1/24
       oliviergeorgeon.com
Intelligence artificielle développementale - 28 octobre 2019 Olivier Georgeon
IA développementale
Définition « développementale »
  •   Relatif au développement (de l'enfant)
Définition « IA »:
  •   Machine qui se comporte de manière intelligente
      •   Machine physique (robot)? ou abstraite (agent programmé)?
      •   Problème: qu’est-ce qu’un comportement intelligent?
          o   Résoudre des problèmes
          o   Catégoriser des donnée
          o   Gagner à un jeu, entretenir une conversation
          o   Test de Turing

Définition « IA développementale »:
  •   Une machine dont l’intelligence se développerait par elle-
      même au fur et à mesure de ses propres expériences.
      •   Devient progressivement capable de se comporter de manière
          intelligente.
      •   Problème: comment mesurer l'évolution de l'intelligence
                                                                      2/24
                                  oliviergeorgeon.com
Intelligence artificielle développementale - 28 octobre 2019 Olivier Georgeon
Ontogénèse vs. phylogénèse

IA développementale:
Ontogénèse.            Ontogénèse

     Phylogénèse

                                             3/24
                       oliviergeorgeon.com
Intelligence artificielle développementale - 28 octobre 2019 Olivier Georgeon
Problème modéliser à priori

                              olivier
                              george
                               4/24
                               on.co
                                 m
Intelligence artificielle développementale - 28 octobre 2019 Olivier Georgeon
IA sans domaine modélisé a priori

O'Regan & Noë (2001)
A sensorimotor account of vision and visual consciousness
O'Regan (2011) "Why red doesn't sound like a bell?"         olivier
                                                            george
                                                             5/24
                                                             on.co
                                                               m
Intelligence artificielle développementale - 28 octobre 2019 Olivier Georgeon
Inversion du cycle d’interaction

•    “The problem of AI is to build agents that receive percepts from
     the environment and perform actions” (Russell et Norvig, 2003, p.
     iv)
•    By observing the structure of the changes that occur when they
     press various buttons and levers (O’Regan & Noë 2001, p. 940).

    a) Traditional model                    b) Inverted model

              Algorithm                             Algorithm

    Percept               Action             Feedback           Action

               Monde                                Monde
    Le
     Ladonnées  d’entrée
        complexité       ne fournissent
                    des données         pasn’a
                                  d’entrée   d’information
                                               pas besoin
              sur un domaine
      d’etre proportionnelle à modélisé  à priori
                               la complexité  du monde
                                                                         6/24
                              oliviergeorgeon.com
Intelligence artificielle développementale - 28 octobre 2019 Olivier Georgeon
La question de la computabilité
•   L'intelligence est-elle computable ?

•   Peut-elle se réduire à un processus exécutable par un
    ordinateur ?

•   Comment un processus informatique déterministe
    pourrait accéder à une forme de libre arbitre ?

•   Déterminisme peut être imprédictible

•   Théorie évolutionniste de la liberté (Dennett 2003).

                                                           7/24
                         oliviergeorgeon.com
Intelligence artificielle développementale - 28 octobre 2019 Olivier Georgeon
Déterminisme
Je suis un système déterministe

Je suis un système non déterministe

                                      8/24
                oliviergeorgeon.com
Déterminisme et prédictibilité
Déterministe
  • Chaque état du système découle de manière
    univoque de l’état précédent
  • Si on « ré-exécute » le système, il se
    comportera exactement de la même manière
Prédictibilité
  • Possibilité de prévoir l’état futur d’un système

                                                       9/24
                      oliviergeorgeon.com
Sources d’imprédictibilité
Indéterminisme
  • physique quantique
Incertitude
  • Connaissance imparfaite des lois
  • Connaissance imparfaite des conditions initiales
Complexité
  • Moyens de calcul insuffisants
Irréductibilité computationnelle
  • L’algorithme qui simule le système ne peut pas être
    court-circuité pour prédire directement le résultat à
    l’étape n.
                                                       10/24
                        oliviergeorgeon.com
Imprédictibilité déterministe
Problème des trois corps
  • Résoudre les équations de Newton de N corps
    interagissant gravitationnellement
  • Henri Poincaré
Jeu de la vie de Conway

Fourmi de Langton
  • https://youtu.be/qZRYGxF6D3w

                                                  11/24
                    oliviergeorgeon.com
Fourmi de Langton

                           12/24
     oliviergeorgeon.com
Idées Clés
L'humain est peut être déterministe mais néanmoins libre
   •   Théorie évolutionniste de la liberté (Dennett 2003).
Système déterministe peut être imprédictible.
   •   Inutile d’utiliser la Fonction Random()
       pour générer des comportements imprédictibles.
   •   Hervé Swirn
Un système déterministe peut « s’individualiser »
   •   En fonction des conditions initiales
   •   En fonction d’expériences individuelles
   •   Autonomie constitutive (Froese & Ziemke 2009).
Emergence de « macro-propriétés »
   •   Souvent non démontrable mais observable depuis un niveau d'observation
       supérieur

                                                                         13/24
                                oliviergeorgeon.com
Exemple plus sophistiqué

Exemple : 6 actions possible

2 feedbacks possibles

                                    -3
  -1          -1          -1   -3        5

                                    -3
  -1          -1          -1   -3        -10

… avec des valeurs
                                         olivier
                                         george
                                         14/24
                                          on.co
                                            m
L'agent qui finissait par comprendre

Avance / collision       (5)          (-10)                 Bump:
Tournes gauche/droite                     (-3)
Touche droite/devant/gauche                          (-1)   Touch:

                                                                     15/24
                               oliviergeorgeon.com
Environnement plus complexe

     https://youtu.be/q8WkYbt2BxM
                                     16/24
               oliviergeorgeon.com
Example

                                   (0) Forward      (0) Turn left
Distal sensory field               Unchanged        Unchanged
                                   (1) Forward      (1) Turn left
     Area A                        Increase         Increase
                                   (1) Forward      (1) Turn left
                                   Increase front   Increase front
           Area B
                                   (-1) Forward     (10) Turn left
                                   Decrease         Decrease
      Area C
                                   (1) Eat

                                   (-1) Bump        Turn right
                                   Wall             (idem …)

                                                                     17/24
                       oliviergeorgeon.com
Bishop behavior

        https://youtu.be/91kKzybt8XY
                                         18/24
                   oliviergeorgeon.com
Rook behavior

                                      19/24
                oliviergeorgeon.com
Exemples de comportements appris
Bishop Behavior                    Rook Behavior

                  Space                            Space

                   Time                             Time

                                                           20/24
                          oliviergeorgeon.com
Auto programmation
Un système auto-programmant est un
système capable d’apprendre du code
qu’il peut ré-exécuter.

Cela pose de nombreuses questions:
  • Quel jeu d’instructions?
  • Quel moteur d’exécution?
  • Quelle finalité?
    •   Pourquoi apprendre un programme plutôt qu’un autre?

                                                        21/24
                        oliviergeorgeon.com
Travaux dirigés

                          22/24
    oliviergeorgeon.com
Exercice Agent 2

Trois actions possibles A = {a1,a2,a3}
Deux résultats possibles F = {f1,f2}
Six interactions possibles E x F = {i11, i12, i21, i22, i31, i32}
Environnement 2

     •   env2: a1 -> f1 , a2 -> f2 , a3 -> f2 (i12 , i21 et i31 ne se produisent jamais)
Systèmes de prédilection 2:

                            a1                a2               a3
          f1                1                 1                -1
          f2                1                 -1               1

Implémenter un agent qui apprenne à effectuer les interactions positives.

Produire un rapport de traces d'activité
                                                                                       23/24
                                     oliviergeorgeon.com
Rapport d’analyse de traces d’activité.
Environnement 2 , Prédilections 2

  action feedback feedback          Anticipation     Prédilection   Excitation
         anticipé reçu
  1        -          1             L                J              J
  1        1          1             J                J              J
  1        1          1             J                J              L
  2        -          2             L                L              J
  2        2          2             J                L              J
  2        2          2             J                L              L
  3        -          2             L                J              J
  3        2          2             J                J              J
  3        2          2             J                J              L
                                                                         24/24
                               oliviergeorgeon.com
Vous pouvez aussi lire