Intelligence artificielle développementale - 29 novembre 2018 Olivier Georgeon
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
Intelligence artificielle développementale 29 novembre 2018 Olivier.georgeon@liris.cnrs.fr http://www.oliviergeorgeon.com 0 10 20 30 40 50 t 1/21 oliviergeorgeon.com
Organisation Rendu Projet • Rapport Vendredi 9 novembre. • Par email olivier.georgeon@liris.cnrs.fr 2/21 oliviergeorgeon.com
Séance 3: Objectifs pédagogiques Après cette séance, vous serez capables de: • Cours • Citer d’autres disciplines scientifiques sources d’inspiration pour l’IA développementale o Expliquer certains concepts clés apportés par ces disciplines o Nommer certaines personnalités qui ont introduit ces concepts clés • Définir la notion d’auto-programmation • TD • Poser les bases pour concevoir un agent capable d’auto-programmation rudimentaire. 3/21 oliviergeorgeon.com
Idées philosophiques clés pour l’IAD Implémenter des systèmes sans présupposés ontologiques. (Kant) • L’agent ne peut pas connaître son environnement « en soi » • Laisser l’agent construire sa propre ontologie de l’environnement au fur et à mesure de son expérience d’interaction. • L’agent sais seulement que « s’il fait telle expérience il obtiendra tel résultat ». Sans objectifs prédéfinis (Heidegger) • Mais avec un système de valeur /préférences Avec une validation par l’usage • Le sens provient de l’usage des connaissances par rapport au système de valeur de l’agent (Philosophie pragmatique: Wittgenstein, James) 4/21 oliviergeorgeon.com
Inspirations mathématiques Théorie du Chaos Hervé Zwirn 5/21 oliviergeorgeon.com
Determinisme Je suis un système déterministe Je suis un système non déterministe 6/21 oliviergeorgeon.com
Déterminisme et prédictibilité Déterministe • Chaque état du système découle de manière univoque de l’état précédent • Si on « ré-exécute » le système, il se comportera exactement de la même manière Prédictibilité • Possibilité de prévoir l’état futur d’un système 7/21 oliviergeorgeon.com
Sources d’imprédictibilité Indéterminisme • physique quantique Incertitude • Connaissance imparfaite des lois • Connaissance imparfaite des conditions initiales Complexité • Moyens de calcul insuffisants Irréductibilité computationnelle • L’algorithme qui simule le système ne peut pas être court-circuité pour prédire directement le résultat à l’étape n. 8/21 oliviergeorgeon.com
Imprédictibilité déterministe Problème des trois corps • Résoudre les équations de Newton de N corps interagissant gravitationnellement • Henri Poincaré Jeu de la vie de Conway Fourmi de Langton • https://youtu.be/qZRYGxF6D3w 9/21 oliviergeorgeon.com
Fourmi de Langton 10/21 oliviergeorgeon.com
Idées Clés Un système déterministe peut être imprédictible. • Inutile d’utiliser la Fonction Random pour générer des comportements inattendus. Un système déterministe peut « s’individualiser » • En fonction des conditions initiales • En fonction d’expériences individuelles Emergence de « macro-propriétés » • Impossibles (ou très difficiles) à prouver • Souvent causées par des « interactions circulaires » • Observable par l’expérience 11/21 oliviergeorgeon.com
Psychologie développementale Apprentissage développemental • Jean Piaget (1896 – 1980) • Téléologie / principes motivationnels • La construction du réel chez l’enfant (1937) o ”l’individu s'auto-finalise de manière récursive”. • Ne pas séparer perception et action a priori: o Notion de schème sensorimoteur Epistémologie contructiviste • Jean-Louis Le Moigne (1931 - ) • Les épistémologies constructivistes (1995) • Ernst von Glasersfeld. • Constructiviste radical 12/21 oliviergeorgeon.com
Etapes développementales indicatives Mois 4: prédictions probabilistes. Mois 5: modèles des mouvements des mains. Mois 6: reconnaissance des objets et des visages. Mois 7: persistance des objets. Mois 8: modèles dynamiques des objets. Mois 9: usage d’outils (amène une tasse à la bouche) Comportements de pointage d’objets. Mois 9: premiers mots simples Mois 10: Imite les mouvements, rampe. Mois 11: marche avec l’aide d’un adulte. Mois 15: marche seul. Le cerveau humain grandit jusqu’à l’age de 25 ans environ 13/21 oliviergeorgeon.com
Idées psychologiques clés pour l’IAD Raisonner sur les « schèmes sensorimoteur » plutôt que séparer perception et action. Définir un niveau intermédiaire de l’intelligence: Raisonnement et langage Haut niveau Inférences semiotique Niveau intérmédiaire Adaptation stimulus-réponse Bas niveau 14/21 oliviergeorgeon.com
Apprentissage de régularités hierarchique Select Time Try to Enact 15/21 oliviergeorgeon.com
Pour pratiquer un peu Little AI: Le jeu où on n'y comprend rien au départ ! • App Store Apple • Chercher "Little AI" • http://little-ai.com/ • https://pierreelliott.github.io/LittleAI- Web/ 16/21 oliviergeorgeon.com
Travaux dirigés 2 17/21 oliviergeorgeon.com
TP2 Deux actions possibles A = {a1,a2} Deux résultats possibles F = {f1,f2} Quatre interactions possibles A x F = {i11, i12, i21, i22} Environnements • env1: a1 -> f1 , a2 -> f2 (i12 et i21 ne se produisent jamais) • env2: a1 -> f2 , a2 -> f1 (i11 et i22 ne se produisent jamais) Systèmes de valeurs motivationnelles : • valeurs1: v(i11) = v(i12) = 1, v(i21) = v(i22) = -1 • valeurs2: v(i11) = v(i12) = -1, v(i21) = v(i22) = 1 • valeurs3: v(i11) = v(i21) = 1, v(i12) = v(i22) = -1 Implémenter un agent qui apprenne à effectuer les interactions positives sans connaître à priori son système de valeur motivationnelles ni son environnement (env1 ou env2). 18/21 oliviergeorgeon.com
Recommendation • Class: Valeurs • Class: Agent(valeurs) • Méthode: play(feedback) -> action • Implémente le mécanisme décisionnel de l'agent • trace • Class: Environnement • Méthode: play(action) -> feedback • Implémente l'environnement • Main • Loop • action = Agent.play(feedback) • feedback = Environnement(action) • 19/21 oliviergeorgeon.com
Analyse de traces d’activité. Motivation1, Motivation1, Environnement 1. Environnement 2. a1,f1,1 a1,f2,-1 a1,f1,1 a2,f1,1 a1,f1,1 a2,f1,1 a1,f1,1 a2,f1,1 a1,f1,1 a2,f1,1 a1,f1,1 a2,f1,1 a1,f1,1 a2,f1,1 a1,f1,1 a2,f1,1 a1,f1,1 a2,f1,1 a1,f1,1 a2,f1,1 20/21 oliviergeorgeon.com
Environnement 3 Se comporte comme Environnement1 pendant les 5 premiers cycles, puis comme environnement2. Implémentation • If (step < 5) • If (action = a1) then feedback = f1 • If (action = a2) then feedback = f2 • Else • If (action = a1) then feedback = f2 • If (action = a2) then feedback = f1 • Step++ 21/21 oliviergeorgeon.com
Vous pouvez aussi lire