L'intelligence artificielle: de la théorie à la pratique 04.12.2018 - NSI-PIXELIXIR Academy
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
Agenda • Introduction • Bots • Reconnaissance d’images & Classification • Exemples de prédictif: machine learning & deep learning • Natural language processing • En pratique
Introduction QU’EST-CE QUE L’INTELLIGENCE ARTIFICIELLE? La construction de programmes informatiques qui s'adonnent à des tâches qui sont, pour l'instant, accomplies de façon plus satisfaisante par des êtres humains car elles demandent des processus mentaux de haut niveau tels que : • l'apprentissage perceptuel, • l'organisation de la mémoire • et le raisonnement critique. Marvin Minsky
Introduction LES 4 PILIERS DES TECHNOLOGIES COGNITIVES Comprendre Raisonner Apprendre Interagir Les systèmes cognitifs Les systèmes cognitifs De chaque interaction, de Avec la possibilité de voir, comprennent l’imagerie, le peuvent identifier des chaque résultat, ils parler et entendre, les langage et d’autres concepts sous-jacents, développent et affinent leur systèmes cognitifs données non structurées - émettre des hypothèses, expertise. Ils n’arrêtent interagissent avec les comme les humaines inférer des raisons, extraire jamais d’apprendre. hommes de manière de des idées. plus en plus naturelle.
Introduction QUAND UTILISER LES TECHNOLOGIES COGNITIVES? • Les problèmes sont complexes, les informations et la situation changent et le résultat dépend du contexte; • Les sources de données sont fluctuantes, il y a des données non structurées (textes, images) • On cherche un ranking (score de confiance), des alternatives • Le problème dépend du contexte: temps, utilisateur, lieu, élément d’une tâche… et ce contexte n’est pas toujours connu. • Un dialogue ou une collaboration homme/machine est requis.
Introduction LES PROJETS ENVISAGÉS des algorithmes de machine learning des assistants intelligents ou chatbots des services d’interaction des applications de cyber-sécurité pour traiter la complexité des nouvelles menaces des applications CRM les robots logiciels (ou RPA automatisation de processus robotique) des infrastructures Cloud (puissance de calcul) des applications financières pour améliorer la détection des fraudes des outils d’analyse d’images des applications financières pour supporter la prise de décision
Chatbots LE FUTUR D’ici 2020, 80% des actes d’achats se produiront sans inclure aucun interaction humain / humain. D’ici 2020, les “smart agents” faciliteront 40% des interactions mobiles et commenceront à dominer l’ère “post app”.
Chatbots QU’EST-CE QU’UN AGENT VIRTUEL (OU CHATBOT)? Un agent virtuel utilise une interface conversationnelle pour permettre à des utilisateurs d’interagir avec une organisation.
Chatbots IL EXISTE DE NOMBREUX CANAUX DE COMMUNICATION • Site web Ajouter un chatbot sur votre site web qui répond aux questions les plus fréquentes de vos clients • Applications mobile Permettre à vos utilisateurs de contrôler l’application en utilisant du langage naturel • Messagerie Construire des chatbots twitter, slack, facebook, messenger qui interagissent avec les clients. • IOT Equiper des objets connectés afin qu’ils comprennent le langage et répondent aux commandes des utilisateurs. • Robots Equiper les robots de services de conversations. • Jeux Introduire la compréhension du langage naturel dans les jeux
Chatbots LES TROIS APPLICATIONS LES PLUS FRÉQUENTES • Service au client Fournir aux clients une approche rapide, simple, disponible à toute heure, afin de résoudre un problème de support ou de répondre à des questions courantes. • (e-)commerce conversationnel Fournir une expérience d’achat guidée aux clients pour faire leurs achats de biens et de service à travers des canaux mobiles ou de messagerie. • Productivité des employés Simplifier l’accès aux questions courantes et aux tâches les plus fréquentes
Chatbots EXEMPLES - FINANCES (1) • Djingo, le conseiller virtuel d'Orange Bank tournant à l'intelligence artificielle d'IBM Watson, réalise en moyenne près de 24.000 conversations par semaine https://www.latribune.fr/entreprises-finance/banques-finance/ia-le-conseiller-virtuel-d-orange-bank-assure-plus-d-une- conversation-sur-deux-770849.html • La mise en place d'IBM Watson aurait permis de libérer 200.000 jours homme au Crédit Mutuel, selon son président. https://www.latribune.fr/entreprises-finance/banques-finance/ia-watson-est-un-investissement-rentable-au-credit- mutuel-769495.html • Démo: https://www.orangebank.fr/
Chatbots EXEMPLES - FINANCES / KBC (2) Actuellement, K’Ching parle néérlandais, français, et bientôt allemand et anglais. Dans ses premiers mois, K’Ching a répondu à 120.000 questions pour près de 24.000 utilisateurs âgés de 15 à 17 ans. Le plus important utilisateur lui a posé 200 questions! Beaucoup de conversations durent plus de 15 minutes. Un second chatbot, Harry, sera déployé et est destiné à l’usage exclusif du département HR.
Chatbots EXEMPLES - TRANSPORT / SNCB (1) Céline, le chatbot de vente de la SNCB sur messenger. Première étape: ouverture “discrète” pendant Pâques 1470 visiteurs uniques 8191 messages 636 checkout 156 GoUnlimited vendus = 10.6% conversion! 85.7% satisfied 1.2% not satisfied Successrate (tout est répondu avec succès) a évolué de 65% à 78% en 10 jours.
Chatbots EXEMPLES - TRANSPORT / SNCB (2) Céline, le chatbot de vente de la SNCB sur messenger. Seconde étape: ouverture pendant l’été 2018 Target: 5000 ventes —> atteint +26% 86% success rate 98.4% satisfaction 11.819 utilisateurs uniques dont 59%—> 6996 utilisateurs uniques (lien de paiement) dont 79%—> 5551 clients
Chatbots LA MODÉLISATION Trois concepts importants entrent en jeu dans la modélisation d’une conversation: • l’intention: le but exprimé par le client dans sa réponse • l’entité: la classe d’objet, le type de données sur laquelle le client veut exercer son intention. • l’arbre de dialogue: une succession de noeuds à travers on programme l’interaction entre le bot et le client.
Chatbots DÉMONSTRATION
Chatbots QUELQUES POINTS D’ATTENTION • architecture de la solution technique • gestion de la langue, accès back-end, extra information management (media,…) … • maintenance/amélioration & benchmarking • evolution / benchmarking • import • architecture de la conversation • calibrage de la conversation (persuasion, humanisation, engagement)
Chatbots LES FACTEURS DE CALIBRATION • Calibrer la conversation implique: • de définir le but du chatbot • d’identifier le point de vue du chatbot • à qui s’adresse-t-il? qui bénéficie de ses conseils? • est-ce que le bot représente les intérêts de quelqu’un/quelque chose? • quel rôle doit il adopter dans la relation avec l’utilisateur final? • de spécifier le facteur de proactivité/réactivité du bot • définir le ton et la personnalité du chatbot
IA: de la théorie à la pratique Images / classification
Reconnaissance d’images EXEMPLES (1)
Reconnaissance d’images EXEMPLES (2)
Reconnaissance d’images EXEMPLES (3) • 3000 radiographies des poumons • 2 classements: • sain • tuberculeux • exemple académique pour illustrer la reconnaissance d’images par défaut • meilleurs résultats avec réseaux de neurones convolutionnels.
Reconnaissance d’images EXEMPLES (3)
Classification EXEMPLES D’APPLICATION DE CLASSEMENT TEXTUELS • Classement des documents lorsque le format visuel ne suffit pas (ex: factures) • Classement des e-mails par type d’action à entreprendre • Classement des plaintes clients pour accélérer le processus de traitement • Classement de commentaires en fonction de l’adhésion à une marque, un produit • …
IA: de la théorie à la pratique Machine learning
Réseaux de neurones MACHINE LEARNING - DÉFINITION Programmation traditionnelle Données ordinateur Résultats Programme Machine learning Données ordinateur Programme Résultats
Réseaux de neurones MACHINE LEARNING - COMMENT CELA FONCTIONNE?
Réseaux de neurones MACHINE LEARNING - MACHINE LEARNING TYPES IN DETAIL
Réseaux de neurones MACHINE LEARNING - CLASSIFICATION VS REGRESSION
Réseaux de neurones MACHINE LEARNING - DEEP LEARNING
Réseaux de neurones QUELQUES APPLICATIONS • reconnaissance d’images sur mesure • prédiction de données • données financières • pression dans une vanne en fonction de paramètre extérieur • fraude • en fonction d’un texte, anticiper la quotation d’un avis sur un produit • prédiction de données dans le temps • apprendre à peindre comme (filtres) • apprendre à parler comme • …
Use case 4 EXEMPLES • différents domaines • différents types d’algorithme (réseaux de neurones // random forest) • différentes problématiques (temporelles ou pas) —> double objectif: - ouvrir le champ des idées - identifier les composantes d’un projet de machine learning
Machine learning - Applications ENTRETIEN D’EMBAUCHE Un consultant RH voudrait savoir si un candidat se présentera à l’entretien d’embauche qui aura lieu chez son client Informations concernant le client Informations concernant le candidat - Sexe - Nom du client - Adresse actuelle - Type d’industrie - Lieu de travail actuel - Adresse de la société - Lieu de naissance - Poste à pourvoir - Etat civil - Compétences recherchées - Réponses à des questions posées par le - Lieu de l’entretien recruteur concernant la disponibilité, la flexibilité - Type d’entretien et la motivation du candidat. Taille du data set: 1227 candidats
Machine learning - Applications ENTRETIEN D’EMBAUCHE
Machine learning - Applications ENTRETIEN D’EMBAUCHE Comment améliorer les prédictions ? A) En optimisant les paramètres de B) En optant pour un autre algorithme la random forest (ex.: un réseau de neurones) Problèmes similaires ‣ Prédire les défauts de paiement et établir des profils types de mauvais payeurs ‣ Prédire les achats d’un client en fonction de son profil ‣ Prédire l’impact de publicités ciblées ‣…
Cours apple LA PROBLÉMATIQUE • sur base d’une évaluation temporelle du cours, prédiction des valeurs suivantes. —> problème temporel
Cours apple QUEL TYPE DE RÉSEAU DE NEURONES UTILISE-T-ON? • Réseau de neurones classique • + spécialisation pour structure de données séquentielle: RNN • + spécialisation pour tenir compte des souvenirs: LSTM
Cours apple BREVE PRÉSENTATION
Cours apple BREVE PRÉSENTATION
Maintenance prédictive NASA PROBLÉMATIQUE • Paramètres sur des moteurs, • Prédiction de maintenance (quand le moteur va-t-il casser?)
Maintenance prédictive NASA SET DE DONNÉES • N° du moteur • RUL=combien de cycles reste-t-il avant la défaillance? • settings = réglages du moteur qui peuvent influencer le nombre de cycle • Capteurs
Maintenance prédictive NASA RÉSULTATS
Machine learning - Applications ANALYSE DU SOMMEIL
Machine learning - Applications ANALYSE DU SOMMEIL Classification des états de sommeil différencier les phases d’éveil, de sommeil léger (N1), modéré (N2), profond (N3) et paradoxal (REM) Cycle 1 Cycle 2 Cycle 3 Cycle 4 Awake REM N1 N2 N3 23:00 00:30 02:00 03:30 05:00
Machine learning - Applications ANALYSE DU SOMMEIL
Machine learning - Applications ANALYSE DU SOMMEIL
Machine learning - Applications Données Cotation d’articles vendus par e-commerce Age de la cliente Titre de la critique Corps de la critique Cliente 1: (51 ans) Mon achat favori! ? J’adore, j’adore, j’adore cette veste! Je me sens rayonnante à chaque fois que je la porte, elle est tout simplement splendide! Cliente 2: (33 ans) Déception totale … La photo est trompeuse. Cette robe, portée, a l’air d’un sac. Je ne la porterais même pas pour Halloween! … Cliente 23486: (26 ans) Chemisier splendide! Je valide complètement! Il est devenu un élément incontournable de ma garde-robe!
Machine learning - Applications Extraction des caractéristiques du text Caractères spéciaux Mots non-pertinents Cotation d’articles vendus par e-commerce Résumer le texte par un vecteur Limiter la taille de ce vecteur « Ceci est une phrase pour entraîner l’algorithme » [«Ceci», «est», «une», «phrase», «pour», «entraîner», «l», «algorithme»] [«Ceci», «phrase», «entraîner», «algorithme»] « Ceci est une phrase pour tester l’algorithme » [1, 1, 0, 1]
Machine learning - Applications Cotation d’articles vendus par e-commerce Résultat final Négatifs Positifs Random forest (500 arbres) 710 6.562 88,5 % Valeurs réelles 1.456 6.764 0 2250 4500 6750 9000 Problèmes similaires ‣ Analyse de sentiment (chatbot, messages, …) ‣ E-réputation d’une entreprise, d’un produit, … ‣ NLP ‣ …
Machine learning DÉCOUPAGE DES DONNÉES
Machine learning - Applications OPTIMISATION Underfitting Overfitting Test erreur Erreur Apprentissage erreur Complexité = Profondeur de l’arbre
Machine learning LES COMPOSANTES D’UN PROJET • choix des données • lesquelles • quelles caractéristiques extraire pour nourrir les algorithmes • analyse de corrélation • normalisation • traitement des données • définition des set de données d’apprentissage, de validation et de test • choix et comparaison des algorithmes • optimisation • …
IA: de la théorie à la pratique NLP
NLP QUE RECOUVRE LE NLP?
NLP COMMENT FONCTIONNE LA RECONNAISSANCE?
NLP OU L’UTILISE-T-ON? • traitement de grandes quantités de textes • moteurs de recherche • traduction • extraction d’information • traitements de textes avancés • filtrage collaboratif • transformation textes/paroles • publicité personnalisée • reconnaissance automatique de la parole • capture de la connaissance • traduction paroles -> paroles • détection des fraudes • génération de textes • analyse de sentiments • découvertes des données cachées (dark data) • veille de réputation • bots • …
NLP DECOUVERTE DE DONNÉES “CACHÉES” (DARK DATA)
NLP EXEMPLE RESA (RECUEIL ÉLECTRONIQUE DES SOCIÉTÉS ET ASSOCIATIONS) • Récupérer des données non structurées légales contenues dans des fichiers aux formats PDF provenant des publications faites au RCSL / RESA
NLP - Watson Knowledge studio Deux types de modèles 1. Modèles basés sur des règles ✓ Information structurée: - « 01/10/2018 » - « martine.dupont@gmail.com » - « BE75 5678 0877 4329 » - « www.pixelixir.com» 2. Modèles basés sur l’apprentissage automatique ✓ Information non structurée: « Angela Merkel se rendra jeudi à Paris pour y rencontrer le Président Emmanuel Macron. »
NLP - Watson Knowledge studio Constitution du système d’entités 1. Types et sous-types d’entités « Angela Merkel se rendra jeudi à Paris pour y rencontrer Types: Personne, Lieu, Jour le Président Emmanuel Macron. » Sous-types: Chancelière, Président 2. Rôles des entités « Le Président des Etats-Unis réside officiellement à la Maison-Blanche. » Rôle: Lieu « La Maison-Blanche ferme la mission palestinienne à Washington. » Rôle: Organisation 3. Relations entre entités « Marie travaille pour IBM. » Relation: EmployéPar
NLP - Watson Knowledge studio Exemple RESA (recueil électronique des sociétés et associations) Text annoté Système d’entités
NLP - Watson Knowledge studio Exemple RESA (recueil électronique des sociétés et associations)
NLP EXEMPLE RESA - CONSTITUTION DU DICTIONNAIRE Précision globale: 92 % Set de 85 documents annotés Capital 1 59 documents pour l’apprentissage Date de constitution 0,96 19 documents pour la validation Forme 0,91 7 documents pour le test Montant 0,86 Nombre 0,89 Précision: Numéro RCS 1 Personne 0,9 Pourcentage d’entités correspondant exactement aux annotations Siege social 0,87 0 0,25 0,5 0,75 1 Précision
NLP EXEMPLE RESA - CONSTITUTION DU DICTIONNAIRE Analyse des performances
NLP VEILLE D’INFORMATION • Une société emploie des experts qui sont compétents sur un certain nombre de thématique. • Ces experts travaillent sur de nombreux projets européens. • Pour maintenir les experts à jour, il faut surveiller près de 1000 sites web! • Le but du projet est d’informer les experts sur les informations parues dans leurs champs de compétences. Il s’agit d’une mise en adéquation entre: - les compétences (centres d’intérêts) des experts - les thématiques identifiées sur une source d’information.
NLP VEILLE D’INFORMATION
NLP VEILLE D’INFORMATION ‣ compiled informations ‣ based on personal preferences ‣ based on SOLR queries ‣ boost factor to highlight specific elements We can deliver very different user profiles!
L’intelligence augmentée avec Watson Récapitulatif
Introduction ZONES D’APPLICATION SECTORIELLE
Un projet? COMMENT COMMENCER? Se focaliser sur des améliorations ayant de la valeur business. • Pour avancer il faut démarrer - et démarrer est plus simple que vous ne le croyez • L’adoption des technologies cognitives prend diverses formes et tailles et la plupart du temps, commence à petite échelle. • Ce que les projets à succès ont en commun (quelle que soit leur ambition), c’est la vision claire de ce que les technologies cognitives peuvent et ne peuvent pas faire. • Dans l’évaluation des technologies cognitives, l’adoption ne fait sens que si elle s’aligne avec des priorités stratégiques. • Votre stratégie d’adoption devrait soutenir des résultats rentables, tels qu’épargner de l’argent, gagner des clients ou augmenter le revenu.
Récapitulatif EN QUOI POUVONS-NOUS VOUS AIDER • identification projet (ROI, qualité des données, visions, …) • choix des techniques à mettre en oeuvre, établissement d’une architecture “cognitive” • choix technologique • sélection et préparation des données • optimisation • transfert de compétences • mise en place des boucles d’améliorations • …
MERCI!
Machine learning - Applications ENTRETIEN D’EMBAUCHE Set d’apprentissage Arbre de décision: 10 A + 20 P Disponibilité Ou N on i Abs Compréhension 7A on Ou N i Abs Prés : Noeud interne 3A 20 A : Noeud externe
Machine learning - Applications ENTRETIEN D’EMBAUCHE Set inconnu Arbre de décision: 5 A + 25 P Disponibilité Ou N on i Abs Compréhension 2A+4P Ou N on i Abs Prés : Noeud interne 2 A + 7P 1 A + 14 P : Noeud externe
Machine learning - Applications Random forest Ensemble d’arbres de décision ENTRETIEN D’EMBAUCHE Input Candidat 700 dont les noeuds sont un peu plus aléatoires Arbre 1 Arbre 2 Arbre 1000 Tree1 Tree2 TreeN Abs Class Prés Class Abs Class Classe majoritaire Majority voting Solution robuste Abs Class
Machine learning - Applications ENTRETIEN D’EMBAUCHE Prédictions du consultant RH 9 65 Prédictions avec une random forest 17 70 Présences et absences réelles 45 78 0 35 70 105 140 Absences Présences
NLP VEILLE D’INFORMATION
Vous pouvez aussi lire