Intelligence artificielle développementale - 28 octobre 2019 Olivier Georgeon
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
Intelligence artificielle développementale 28 octobre 2019 Olivier.georgeon@liris.cnrs.fr http://www.oliviergeorgeon.com 0 10 20 30 40 50 t 1/24 oliviergeorgeon.com
IA développementale Définition « développementale » • Relatif au développement (de l'enfant) Définition « IA »: • Machine qui se comporte de manière intelligente • Machine physique (robot)? ou abstraite (agent programmé)? • Problème: qu’est-ce qu’un comportement intelligent? o Résoudre des problèmes o Catégoriser des donnée o Gagner à un jeu, entretenir une conversation o Test de Turing Définition « IA développementale »: • Une machine dont l’intelligence se développerait par elle- même au fur et à mesure de ses propres expériences. • Devient progressivement capable de se comporter de manière intelligente. • Problème: comment mesurer l'évolution de l'intelligence 2/24 oliviergeorgeon.com
Ontogénèse vs. phylogénèse IA développementale: Ontogénèse. Ontogénèse Phylogénèse 3/24 oliviergeorgeon.com
IA sans domaine modélisé a priori O'Regan & Noë (2001) A sensorimotor account of vision and visual consciousness O'Regan (2011) "Why red doesn't sound like a bell?" olivier george 5/24 on.co m
Inversion du cycle d’interaction • “The problem of AI is to build agents that receive percepts from the environment and perform actions” (Russell et Norvig, 2003, p. iv) • By observing the structure of the changes that occur when they press various buttons and levers (O’Regan & Noë 2001, p. 940). a) Traditional model b) Inverted model Algorithm Algorithm Percept Action Feedback Action Monde Monde Le Ladonnées d’entrée complexité ne fournissent des données pasn’a d’entrée d’information pas besoin sur un domaine d’etre proportionnelle à modélisé à priori la complexité du monde 6/24 oliviergeorgeon.com
La question de la computabilité • L'intelligence est-elle computable ? • Peut-elle se réduire à un processus exécutable par un ordinateur ? • Comment un processus informatique déterministe pourrait accéder à une forme de libre arbitre ? • Déterminisme peut être imprédictible • Théorie évolutionniste de la liberté (Dennett 2003). 7/24 oliviergeorgeon.com
Déterminisme Je suis un système déterministe Je suis un système non déterministe 8/24 oliviergeorgeon.com
Déterminisme et prédictibilité Déterministe • Chaque état du système découle de manière univoque de l’état précédent • Si on « ré-exécute » le système, il se comportera exactement de la même manière Prédictibilité • Possibilité de prévoir l’état futur d’un système 9/24 oliviergeorgeon.com
Sources d’imprédictibilité Indéterminisme • physique quantique Incertitude • Connaissance imparfaite des lois • Connaissance imparfaite des conditions initiales Complexité • Moyens de calcul insuffisants Irréductibilité computationnelle • L’algorithme qui simule le système ne peut pas être court-circuité pour prédire directement le résultat à l’étape n. 10/24 oliviergeorgeon.com
Imprédictibilité déterministe Problème des trois corps • Résoudre les équations de Newton de N corps interagissant gravitationnellement • Henri Poincaré Jeu de la vie de Conway Fourmi de Langton • https://youtu.be/qZRYGxF6D3w 11/24 oliviergeorgeon.com
Fourmi de Langton 12/24 oliviergeorgeon.com
Idées Clés L'humain est peut être déterministe mais néanmoins libre • Théorie évolutionniste de la liberté (Dennett 2003). Système déterministe peut être imprédictible. • Inutile d’utiliser la Fonction Random() pour générer des comportements imprédictibles. • Hervé Swirn Un système déterministe peut « s’individualiser » • En fonction des conditions initiales • En fonction d’expériences individuelles • Autonomie constitutive (Froese & Ziemke 2009). Emergence de « macro-propriétés » • Souvent non démontrable mais observable depuis un niveau d'observation supérieur 13/24 oliviergeorgeon.com
Exemple plus sophistiqué Exemple : 6 actions possible 2 feedbacks possibles -3 -1 -1 -1 -3 5 -3 -1 -1 -1 -3 -10 … avec des valeurs olivier george 14/24 on.co m
L'agent qui finissait par comprendre Avance / collision (5) (-10) Bump: Tournes gauche/droite (-3) Touche droite/devant/gauche (-1) Touch: 15/24 oliviergeorgeon.com
Environnement plus complexe https://youtu.be/q8WkYbt2BxM 16/24 oliviergeorgeon.com
Example (0) Forward (0) Turn left Distal sensory field Unchanged Unchanged (1) Forward (1) Turn left Area A Increase Increase (1) Forward (1) Turn left Increase front Increase front Area B (-1) Forward (10) Turn left Decrease Decrease Area C (1) Eat (-1) Bump Turn right Wall (idem …) 17/24 oliviergeorgeon.com
Bishop behavior https://youtu.be/91kKzybt8XY 18/24 oliviergeorgeon.com
Rook behavior 19/24 oliviergeorgeon.com
Exemples de comportements appris Bishop Behavior Rook Behavior Space Space Time Time 20/24 oliviergeorgeon.com
Auto programmation Un système auto-programmant est un système capable d’apprendre du code qu’il peut ré-exécuter. Cela pose de nombreuses questions: • Quel jeu d’instructions? • Quel moteur d’exécution? • Quelle finalité? • Pourquoi apprendre un programme plutôt qu’un autre? 21/24 oliviergeorgeon.com
Travaux dirigés 22/24 oliviergeorgeon.com
Exercice Agent 2 Trois actions possibles A = {a1,a2,a3} Deux résultats possibles F = {f1,f2} Six interactions possibles E x F = {i11, i12, i21, i22, i31, i32} Environnement 2 • env2: a1 -> f1 , a2 -> f2 , a3 -> f2 (i12 , i21 et i31 ne se produisent jamais) Systèmes de prédilection 2: a1 a2 a3 f1 1 1 -1 f2 1 -1 1 Implémenter un agent qui apprenne à effectuer les interactions positives. Produire un rapport de traces d'activité 23/24 oliviergeorgeon.com
Rapport d’analyse de traces d’activité. Environnement 2 , Prédilections 2 action feedback feedback Anticipation Prédilection Excitation anticipé reçu 1 - 1 L J J 1 1 1 J J J 1 1 1 J J L 2 - 2 L L J 2 2 2 J L J 2 2 2 J L L 3 - 2 L J J 3 2 2 J J J 3 2 2 J J L 24/24 oliviergeorgeon.com
Vous pouvez aussi lire