Intelligence artificielle développementale - 28 octobre 2019 Olivier Georgeon
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
Intelligence artificielle
développementale
28 octobre 2019
Olivier.georgeon@liris.cnrs.fr
http://www.oliviergeorgeon.com
0 10 20 30 40 50
t
1/24
oliviergeorgeon.comIA développementale
Définition « développementale »
• Relatif au développement (de l'enfant)
Définition « IA »:
• Machine qui se comporte de manière intelligente
• Machine physique (robot)? ou abstraite (agent programmé)?
• Problème: qu’est-ce qu’un comportement intelligent?
o Résoudre des problèmes
o Catégoriser des donnée
o Gagner à un jeu, entretenir une conversation
o Test de Turing
Définition « IA développementale »:
• Une machine dont l’intelligence se développerait par elle-
même au fur et à mesure de ses propres expériences.
• Devient progressivement capable de se comporter de manière
intelligente.
• Problème: comment mesurer l'évolution de l'intelligence
2/24
oliviergeorgeon.comOntogénèse vs. phylogénèse
IA développementale:
Ontogénèse. Ontogénèse
Phylogénèse
3/24
oliviergeorgeon.comIA sans domaine modélisé a priori
O'Regan & Noë (2001)
A sensorimotor account of vision and visual consciousness
O'Regan (2011) "Why red doesn't sound like a bell?" olivier
george
5/24
on.co
mInversion du cycle d’interaction
• “The problem of AI is to build agents that receive percepts from
the environment and perform actions” (Russell et Norvig, 2003, p.
iv)
• By observing the structure of the changes that occur when they
press various buttons and levers (O’Regan & Noë 2001, p. 940).
a) Traditional model b) Inverted model
Algorithm Algorithm
Percept Action Feedback Action
Monde Monde
Le
Ladonnées d’entrée
complexité ne fournissent
des données pasn’a
d’entrée d’information
pas besoin
sur un domaine
d’etre proportionnelle à modélisé à priori
la complexité du monde
6/24
oliviergeorgeon.comLa question de la computabilité
• L'intelligence est-elle computable ?
• Peut-elle se réduire à un processus exécutable par un
ordinateur ?
• Comment un processus informatique déterministe
pourrait accéder à une forme de libre arbitre ?
• Déterminisme peut être imprédictible
• Théorie évolutionniste de la liberté (Dennett 2003).
7/24
oliviergeorgeon.comDéterminisme
Je suis un système déterministe
Je suis un système non déterministe
8/24
oliviergeorgeon.comDéterminisme et prédictibilité
Déterministe
• Chaque état du système découle de manière
univoque de l’état précédent
• Si on « ré-exécute » le système, il se
comportera exactement de la même manière
Prédictibilité
• Possibilité de prévoir l’état futur d’un système
9/24
oliviergeorgeon.comSources d’imprédictibilité
Indéterminisme
• physique quantique
Incertitude
• Connaissance imparfaite des lois
• Connaissance imparfaite des conditions initiales
Complexité
• Moyens de calcul insuffisants
Irréductibilité computationnelle
• L’algorithme qui simule le système ne peut pas être
court-circuité pour prédire directement le résultat à
l’étape n.
10/24
oliviergeorgeon.comImprédictibilité déterministe
Problème des trois corps
• Résoudre les équations de Newton de N corps
interagissant gravitationnellement
• Henri Poincaré
Jeu de la vie de Conway
Fourmi de Langton
• https://youtu.be/qZRYGxF6D3w
11/24
oliviergeorgeon.comFourmi de Langton
12/24
oliviergeorgeon.comIdées Clés
L'humain est peut être déterministe mais néanmoins libre
• Théorie évolutionniste de la liberté (Dennett 2003).
Système déterministe peut être imprédictible.
• Inutile d’utiliser la Fonction Random()
pour générer des comportements imprédictibles.
• Hervé Swirn
Un système déterministe peut « s’individualiser »
• En fonction des conditions initiales
• En fonction d’expériences individuelles
• Autonomie constitutive (Froese & Ziemke 2009).
Emergence de « macro-propriétés »
• Souvent non démontrable mais observable depuis un niveau d'observation
supérieur
13/24
oliviergeorgeon.comExemple plus sophistiqué
Exemple : 6 actions possible
2 feedbacks possibles
-3
-1 -1 -1 -3 5
-3
-1 -1 -1 -3 -10
… avec des valeurs
olivier
george
14/24
on.co
mL'agent qui finissait par comprendre
Avance / collision (5) (-10) Bump:
Tournes gauche/droite (-3)
Touche droite/devant/gauche (-1) Touch:
15/24
oliviergeorgeon.comEnvironnement plus complexe
https://youtu.be/q8WkYbt2BxM
16/24
oliviergeorgeon.comExample
(0) Forward (0) Turn left
Distal sensory field Unchanged Unchanged
(1) Forward (1) Turn left
Area A Increase Increase
(1) Forward (1) Turn left
Increase front Increase front
Area B
(-1) Forward (10) Turn left
Decrease Decrease
Area C
(1) Eat
(-1) Bump Turn right
Wall (idem …)
17/24
oliviergeorgeon.comBishop behavior
https://youtu.be/91kKzybt8XY
18/24
oliviergeorgeon.comRook behavior
19/24
oliviergeorgeon.comExemples de comportements appris
Bishop Behavior Rook Behavior
Space Space
Time Time
20/24
oliviergeorgeon.comAuto programmation
Un système auto-programmant est un
système capable d’apprendre du code
qu’il peut ré-exécuter.
Cela pose de nombreuses questions:
• Quel jeu d’instructions?
• Quel moteur d’exécution?
• Quelle finalité?
• Pourquoi apprendre un programme plutôt qu’un autre?
21/24
oliviergeorgeon.comTravaux dirigés
22/24
oliviergeorgeon.comExercice Agent 2
Trois actions possibles A = {a1,a2,a3}
Deux résultats possibles F = {f1,f2}
Six interactions possibles E x F = {i11, i12, i21, i22, i31, i32}
Environnement 2
• env2: a1 -> f1 , a2 -> f2 , a3 -> f2 (i12 , i21 et i31 ne se produisent jamais)
Systèmes de prédilection 2:
a1 a2 a3
f1 1 1 -1
f2 1 -1 1
Implémenter un agent qui apprenne à effectuer les interactions positives.
Produire un rapport de traces d'activité
23/24
oliviergeorgeon.comRapport d’analyse de traces d’activité.
Environnement 2 , Prédilections 2
action feedback feedback Anticipation Prédilection Excitation
anticipé reçu
1 - 1 L J J
1 1 1 J J J
1 1 1 J J L
2 - 2 L L J
2 2 2 J L J
2 2 2 J L L
3 - 2 L J J
3 2 2 J J J
3 2 2 J J L
24/24
oliviergeorgeon.comVous pouvez aussi lire