Le Web sémantique et ses applications au commerce électronique et aux systèmes d'information
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
Le Web sémantique et ses applications au commerce électronique et aux systèmes d'information Equipes participant au projet • Equipe « Recherche opérationnelle appliquée, systèmes d'information, instruments d'aide à la décision et dynamique des organisations » du LAMSADE • Equipe « Intelligence artificielle et processus de décision » du LAMSADE • Equipe « Bases de données et génie logiciel » du LAMSADE • Equipe « Modèles de l'informatique répartie : Aide à la conception, vérification et évaluation » du LAMSADE • Equipe « Analyse de Données, Probabilité et Statistique » du CEREMADE Contexte du projet Le Web sémantique est un projet qui vise à transformer les technologies logicielles Web de manière à ce que : • d’une part, l’information contenue dans les innombrables fichiers de données des machines connectées au Web soit exploitable de façon optimale, • d’autre part que les applications locales ou réparties puissent coopérer quelque soit leur modèle de développement. Les fondations de ce projet sont certainement XML, modèle de représentation de données semi structurées et les services Web, formalisme de déclaration d’invocation d’une application « affichée » sur le Web. Cependant si ces technologies répondent au besoin d’interopérabilité syntaxique, elles ne répondent pas au besoin d’interopérabilité « sémantique » indispensable aux objectifs du projet. Ces insuffisances sont à l’origine de nombreux projets de recherche actuels dont celui que nous proposons ici. Les enjeux et les retombées industriels du Web sémantique sont de première importance ce qui explique l’investissement des entreprises « leader » de l’informatique telles que IBM, HP, Sun, Microsoft, Oracle, etc. Nous décrivons ci-dessous les impacts potentiels du Web sémantique sur l’activité des entreprises. • L’aide à la décision suppose la synthèse et l’extraction d’informations pertinentes dans une masse d’informations opérationnelles. Le Web sémantique fournira le moyen d’analyse de données hétérogènes et réparties. • Le développement de l’activité commerciale sera favorisé par une plus grande réactivité et une meilleure adéquation aux besoins des clients lors de la construction en temps réel de propositions. • Le partage d’informations au sein de l’entreprise et l’extraction de connaissances sont des éléments clefs du fonctionnement de celle-ci. Ce processus sera certainement favorisé par les méthodes de construction des ontologies associées au Web sémantique. • L’automatisation des tâches administratives qui a connu un premier essor avec les outils de travail coopératif devrait se généraliser et couvrir des tâches plus complexes. Objectifs du projet
Ce projet vise à proposer des modèles formels de conception et d’analyse des différents composants du Web sémantique, à développer des prototypes correspondant à ces modèles et à valider les modèles dans un contexte réel. Nous détaillons maintenant les travaux qui s’inscriront dans ce cadre. 1. Négociation, apprentissage et commerce électronique Initialement associée au commerce électronique, la négociation automatique consiste en un échange d’offres et de contre-offres entre agents vendeurs et agents acheteurs jusqu’à un éventuel accord sur un produit et son prix. Dans ce cadre, nous nous intéressons d’une part au développement d’agents de négociation pour la dématérialisation des achats publics (GtoB procurement) et d’autre part à l’apprentissage de stratégies de négociation. Agents de négociation pour la dématérialisation des achats publics Les procédures d’achat public se veulent équitables et transparentes. Elles s’appuient sur des règles strictes de négociation qui diffèrent selon les marchés. La dématérialisation des achats entraîne une transmission de l’information sous forme de documents XML et une automatisation du processus de négociation. Notre objectif est de prendre en compte la grande variété de mécanismes de négociation, correspondant à ces différentes procédures d’achat. A cette fin, nous nous proposons de définir : • une ontologie des marchés publics, • une ontologie de négociation, • un langage de spécification qui définit, à l’aide de l’ontologie de négociation, les règles de négociation dans une procédure d’achat, • une architecture Multi-Agent flexible et générique conforme à FIPA qui permet de générer les agents participant à la négociation à partir des spécifications du marché et de la procédure d’achat. Afin d’améliorer les capacités de négociation des agents, des techniques d’apprentissage peuvent être mises en oeuvre. Plus précisément, l’apprentissage peut intervenir de deux façons différentes. La première approche consiste à modéliser le comportement de l’agent adverse afin de prédire quelles offres cet agent peut accepter. Un tel modèle s’élabore durant la négociation et s’utilise pour guider l’algorithme de négociation. Différentes techniques d’apprentissage peuvent être envisagées selon les hypothèses que l’on fait concernant le comportement de l’adversaire. Par exemple, si l’on suppose que le comportement de l’agent adverse dépend de son passé, on s’orientera vers des techniques d’apprentissage de séquences (e.g. apprentissage de processus gaussiens). Dans le cas contraire, on peut par exemple utiliser des méthodes standards comme les réseaux bayésiens, l’apprentissage en ligne, etc. L’approche alternative est l’apprentissage direct d’une stratégie de négociation, ce qui relève typiquement de l’apprentissage par renforcement. Dans ce cas, l’agent adverse n’est plus nécessairement modélisé explicitement, du fait que l’agent apprenant tente d’estimer ses propres chances de succès dans la négociation. La seconde approche (l’apprentissage direct d’une stratégie) soulève quant à elle de nombreuses questions théoriques : si l’agent adverse est lui-même doté de facultés d’apprentissage, la procédure d’apprentissage peut-elle converger, ou y aura-t-il des phénomènes de bouclage ? Quelles sont les spécificités du cadre de la négociation pour l’apprentissage par renforcement ? Comment intégrer aux algorithmes d’apprentissage par renforcement classique une stratégie de négociation « de base », afin que l’apprenant ne parte pas de zéro ?
2. Interactions de services Web complexes Les services Web sont des applications modulaires incluant la description de leurs fonctionnalités et pouvant être publiée, localisées et invoquées à travers le Web. Le cadre conceptuel des services Web recouvre trois aspects : les protocoles de communication applicatifs, la description de services et la découverte de services. Cependant l'interaction avec un service Web reste élémentaire et similaire à un appel de procédure à distance. Or les besoins des utilisateurs conduisent à des applications complexes nécessitant un contrôle à travers un modèle explicite de processus. Ce type de service introduit un nouveau problème : les clients doivent gérer une interaction longue (i.e. avec état) avec un service dont la spécification est découverte à l'exécution. L'un des buts de notre travail est de concevoir un agent générique capable de dialoguer de manière correcte avec n'importe quel service et ceci en se basant uniquement sur sa description formelle. La plupart des langages de spécification (WSFL, XLANG, BPEL4WS) proposent un ensemble d'opérateurs afin de décrire le service de façon modulaire. Bien que ces opérateurs ressemblent aux constructeurs d'un langage de programmation, une spécification est principalement la description du comportement observable du service à partir des messages échangés avec le client. Aussi par construction, ce comportement est non déterministe en raison des choix internes du serveur. De plus, la spécification inclut souvent des contraintes de temps. La démarche que nous proposons est donc la suivante. Premièrement, nous spécifions ce qu'est un comportement, autrement dit nous enrichissons les langages de service Web d'une sémantique opérationnelle exprimée comme un système de transitions temporisés. Puis nous définissons une relation entre deux systèmes communicants qui formalise le concept d'une interaction correcte. Enfin nous développons des algorithmes de synthèse d'un client (déterministe) qui vérifie la relation d'interaction avec le service. Certaines spécifications, dites ambiguës, n'admettent aucun client qui vérifie la relation d'interaction. Aussi les algorithmes doivent soit détecter l'ambiguïté d'un service Web soit générer un modèle formel d'un « bon » client (e.g. un automate temporisé déterministe). Dans ce projet, nous proposerons également un cadre conceptuel et architectural pour l'interopérabilité des systèmes multi-agents (SMA) hétérogènes. Notre approche est fondée à nouveau sur les services Web, qui permettent à des applications d'exposer leurs fonctionnalités au travers d'interfaces standardisées. Ils favorisent ainsi une architecture orientée services, intégrant des systèmes hétérogènes complexes, fortement distribués et pouvant coopérer sans recourir à une intégration spécifique et coûteuse. Dans notre modèle, les agents publieront leurs capacités en tant que services Web pouvant être utilisés par d'autres agents et ce indépendamment des caractéristiques conceptuelles (architecture, modèle d'interaction, etc.) et techniques (plate-forme, langage de programmation, etc.) de ces agents. 3. Web mining Le Web mining comporte deux aspects complémentaires : le « Web content mining » et le « Web usage mining ». Le Web content mining concerne l'extension du text mining à des documents contenant des structures de liens hypertextuels. Le Web usage mining concerne les méthodes de traitement, de détection et d'analyse de comportement d'utilisateurs sur les sites Web. Décrire et analyser les concepts sous-jacents des données issues du Web de taille parfois gigantesques de façon à en extraire des connaissances nouvelles constituent une tâche d'importance grandissante. Ces concepts peuvent seulement être décrits par des données plus complexes : variables à valeur, intervalle, histogramme, loi, etc. parfois structurées par des
règles ou des taxonomies. L'analyse des données symboliques, sa théorie et son cadre informatique mis au point par la participation de 17 équipes européennes à deux projets européens d'EUROSTAT (SODAS et ASSO) ouvrent la voie à de nombreuses directions de recherche à l'interface entre les bases de données et les statistiques en permettant en entrée des données plus complexes car aptes à décrire des concepts qui constituent de nouvelles unités statistiques sur lesquels il faut étendre les langages d'interrogation, les méthodes à ce type de données et les grands outils de la statistique descriptive, exploratoire ou décisionnelle. Il est ainsi possible de sortir du carcan (imposé actuellement par les logiciels de statistiques ou de data mining), des tableaux de données classiques où les unités sont seulement décrites par des variables quantitatives ou qualitatives. Ces recherches peuvent déboucher sur une meilleure connaissance du profil des utilisateurs du Web, connaître les centres d'intérêts des utilisateurs pour adapter le contenu de site, connaître le comportement des utilisateurs pour adapter l'ergonomie du site. L'analyse des données exploratoire, la classification automatique, L'analyse des données symbolique, le « data mining », le passage des données aux connaissances constituent dans cette optique des directions de recherche très ouvertes au champ d'application considérable. 4. Systèmes d'annotation et de notification Dans la lignée du thème précédent, nous nous proposons d'étudier les mécanismes de description de ressources du Web et l'utilisation de ces descriptions comme support pour des fonctionnalités de recherche, de notification et de personnalisation. Le Web peut être vu comme une immense bibliothèque de documents aux formats et contenus très hétérogènes. De plus cette bibliothèque évolue de manière souvent imprévisible, soit par ajout/suppression de documents, soit par modification du contenu des documents existants. Une démarche essentielle pour pallier les obstacles soulevés par cette diversité est la production de méta- données ou annotations, qui fournissent une description structurée des ressources et permettent donc le développement de services divers. Ces méta-données peuvent être obtenues soit par analyse textuelle (cf. ci-dessus) soit par annotation manuelle, soit enfin par des mécanismes d'inférence qui s'appuient sur le contexte d'un document (par exemple les liens hypertextes qui lient ce document au reste du Web) où des ontologies décrivant le domaine de connaissance. Nous nous proposons d'étudier ces mécanismes de productions de méta-données dans des situations plus contraintes que le Web pris dans sa généralité: bibliothèques numériques, systèmes d'enseignement à distance (ressources pédagogiques), systèmes d'information d'entreprise. Nous visons également à formaliser et expérimenter divers types de services s'appuyant sur ces méta-données : • recherche et parcours d'information (« Donnez moi tous les emails, factures, devis et propositions commerciales relatives à CE client ») • notification/alerte (« Prévenez-moi si un évènement de n'importe quel type (facturation, envoi/réception d'email ou de proposition commerciale) survient pour CE client dans les deux prochaines semaines ») • personnalisation (« Offrez-moi une vision et/ou des parcours spécifiques du système d'information basés sur mon profil ») Ces axes de recherche se rattachent, au sein du Web sémantique, à tout ce qui relève de la gestion d'ontologies, de systèmes collaboratifs et distribués et de langages de description et de raisonnements.
5. La gestion des connaissances Les ontologies sont considérées comme une technologie clef pour la gestion de connaissance (Knowledge Management) en grande partie parce qu’elles aident à apporter une représentation commune dans la manière où l’expertise est décrite. Cette représentation commune concerne non seulement la terminologie mais également la manière dont les concepts et les objets peuvent être organisés et structurés dans un domaine. Par essence, les ontologies sont des spécifications formelles et consensuelles de conceptualisations qui proviennent d’une compréhension partagée et commune d’un domaine, une compréhension qui peut être transmise par les personnes et les systèmes d’information. Dans un monde globalisé, fondé sur une société de l’information structurée en réseaux, et des entreprises qui se trouvent au cœur des mouvements économiques et sociaux, les connaissances sont devenues une ressource immatérielle primordiale. Les concepts de «Système d’Information», d’«Entreprise Étendue» et de «Knowledge Management» recouvrent de nombreuses acceptions selon les courants d’influence (managérial versus technologique). Ainsi il n’existe pas de modèles stables de ces trois concepts et de leurs impacts sur les performances de l’organisation. Les organisations ont besoin de référentiels leur permettant d’intégrer ces concepts dans leur vision stratégique et d’en tenir compte en tant que facteur d’amélioration des performances. La finalité de la gestion de connaissance pour le Web sémantique est de créer des instruments de référence (modèles, méthodes et outils) permettant de définir des ontologies pour les «entreprises étendues». Les ontologies doivent être dynamiques, c'est-à-dire qu’une connaissance ayant un schéma interprétatif pour une communauté doit pouvoir être intégrée comme concept. Ce concept pouvant soit être modifié si son schéma évolue, soit disparaître de l’ontologie si son schéma n’est plus acceptable par la communauté. Notre étude se déclinera selon les thèmes suivants : • Modéliser l’entreprise étendue et son système d’information. • Modéliser le processus de création de sens dans le cadre d’une décision collective. • Construire un modèle global de knowledge management de l’entreprise (MGKME) qui établisse les liens entre les théories des organisations et du management, l’aide à la décision, la sociologie des organisations. Instrumenter ce modèle par des méthodes et des outils (ontologies, approches, méthodes d’ingénierie des besoins et de conduite de projets, grilles d’analyse et de synthèse, atelier logiciel et algorithmes d’aide à la décision). • Apporter les éléments nécessaires à la spécification d’artefacts et de logiciels applicatifs intégrant les connaissances (portails d’entreprise, atelier logiciel supports des démarches mise en oeuvre, algorithmes et outils d’évaluation des résultats). Ces recherches reposent sur les travaux en système d’information (SI), en ingénierie des connaissances (IC) en knowledge management (KM) et en aide à la décision individuelle et collective , en reprenant différents modèles, techniques et méthodes dont : • les langages de modélisation, les méthodes de conception et les outils informatiques (Internet, outils de travail coopératif, outils de gestion des contenus, moteurs de recherche, portails) issus des recherches en système d’information ; • les méthodes et outils d’acquisition et de représentation des connaissances issus des recherches en ingénierie des connaissances ; • le cadre directeur GAMETH pour repérer les connaissances cruciales issu des recherches en KM ;
• les techniques et méthode de l'analyse multicritères issus des recherches en aide à la décision. Ainsi, ces recherches contribuent à alimenter les réflexions sur les constructions des ontologies associées au Web sémantique dans le cadre des entreprises étendues, par une fertilisation croisée de ces domaines. Collaborations nationales INRETS, GRETIA Arcueil, G. Scemama INRA Grignon, J-M Attonaty CIRAD Montpellier, J-P Müller ITAVI (Institut technique de l’aviculture), I. Bouvarel LIP6 thème OASIS, Université Paris 6, J-P. Briot, A. El Fallah LIPN, Université Paris-Nord: P. Dague LEIBNIZ équipe MAGMA, Université Grenoble, Y. Demazeau LRI, Université Orsay, P. Rigaux, N. Spyratos LIP6 thème SRC, Université Paris 6, F. Kordon, B. Folliot, P. Sens CEDRIC, CNAM Paris, C. Kaiser, K. Barkaoui LABRI, Université Bordeaux 1, J-M. Couvreur LAAS, Toulouse, F. Vernadat CRESTIC, Université Reims, P.Moreaux, H. Fouchal LIP6 pôle IA, Université Paris 6, P. Brezillon Ecole Normale Supérieure de Cachan, A. David Laria, Amiens, G. Kassel LIRIS,Université Claude Bernard Lyon1, A. Mille CGS, école des Mines de Paris, J C Sardas IRIT – INPT Equipe CSCToulouse, P. Zaraté Collaborations internationales Carnegie Mellon Université, CMU, Robotic Institute, K. Sycara Université de Lisbonne, LABMAG, Laboratoire de Modélisation d’Agents, Faculté de Sciences (FCUL), H. Coelho ISCTE – DCTI Lisbonne, J. A. Louçã Imperial College Londres, F. Toni Université de Chypres, A. Kakas, P. Moraitis Centro de Informática (CIn) Universidade Federal de Pernambuco, G. Ramalho Laval University, Quebec, B. Moulin, B. Chaib-Draa Department of Information Technology, The Poznan University of Economics, W. Cellary Instituto de Computaçao, UNICAMP Campinas, Brasil, C. B. Medeiros New Jersey Institute (USA), V. Oria Université de Turin, S. Donatelli, G. Franceschinis Université de Saragosse, M. Silva Birbeck College, Londres, A. Poulovassilis Institut FORTH, Crète, V. Christophides University Of South Florida (USF), Chair Information Systems & Decision Sciences College of Business Administration Tampa, Stanley J. Birkin University of Cologne, Germany, C. Loebbeck : Universita Cattolica de Milan, M de Marco, M Sorrentino et A Carignani CEN/ISSS (Centre Européen de Normalisation/ Information Society Standardization System)
Participation au réseau d’excellence international AGENTLINK PAI (EGIDE) avec l’Université de Lisbonne. Contrat Européen : responsable scientifique du projet européen d'EUROSTAT intitulé ASSO qui réunit quinze équipes européennes de 9 pays avec pour objectif de réaliser un logiciel d'Analyse de données symboliques orienté traitement de données provenant d'enquêtes relevant de la statistique officielle. Contrat de recherche entre la NSF et l’INRIA portant sur l’Analyse des Données Symboliques. L. Billard (UGA) resp. Etats-Unis. Relation avec le projet d’enseignement de l’Université Ce projet s’articule avec le projet LMD de l’Université (prévu pour la rentrée 2005) à la fois sur le volet professionnel et sur le volet recherche : • Volet professionnel avec le pôle des 3 DESS Informatique (Informatique Décisionnelle, Systèmes d’Information et Technologies Nouvelles, Technologies de l’Internet pour les Organisations) qui comprennent des enseignements sur l’analyse de données, le développement des applications Internet, la mise en place des services Web, l’impact des technologies « Web » sur la conception des systèmes d’information et sur l’activité commerciale • Volet Recherche avec le DEA 127 des Systèmes Intelligents auxquels collaborent la plupart des équipes et qui décline le projet sur les aspects de modélisation formelle et algorithmique. Publications récentes en rapport avec le projet S. Haddad, T. Melliti, P. Moreaux, S. Rampacek « A dense time semantics for Web services specifications languages » IEEE First International Conference on Information & Communication Technologies: from Theory to Applications Damas, Syrie, Avril 2004 S. Haddad, T. Melliti, P. Moreaux, S. Rampacek « Modelling Web Services Interoperability » 6th International Conference on Enterprise Information Systems Porto, Portugal, Avril 2004 T. Melliti, S. Haddad « Synthesis of Agents for Web Service Interaction » Workshop Semantic Web Services for Enterprise Application Integration and E-Commerce of the Fifth International Conference on Electronic Commerce Pittsburgh. USA Octobre 2003 J. El Haddad, S. Haddad « Algorithmes de communication auto-stabilisants dans un système de robots mobiles » Colloque Francophone sur la Modélisation des Systèmes Réactifs (MSR'03) Metz. France Octobre 2003 J. El Haddad, S. Haddad « Self-Stabilizing Scheduling Algorithm for Cooperating Robots » ACS/IEEE International Conference on Computer Systems and Applications (AICCSA'03) Tunis Tunisie. Juillet 2003 L. Billard, E. Diday « From the Statistics of Data to the Statistics of Knowledge: Symbolic Data Analysis » JASA. Journal of the American Statistical Association. Juin, Vol. 98, N° 462, 2003
E. Diday , R. Emilion « Maximal and stochastic Galois Lattices » Journal of Discrete Applied Mathematics . 127 , 271-284, 2003 E. Diday, F. Esposito « An introduction to Symbolic Data Analysis and the Sodas Software » IDA. International Journal on Intelligent Data Analysis, Volume 7, issue 6. december 2003. E. Diday « Analyse des données symboliques: théorie et outil pour la fouille de connaissances » TSI (Technique et Science Informatiques). Vol 19, n°1-2-3 , Janvier 2000. Ciampi, E. Diday, J. Lebbe, E. Perinel, R. Vignes « Growing a tree classifier with imprecise data » Pattern Recognition letters 21, pp 787-803. 2000 S. Aknine, S. Pinson, S. Shakun « An Extended Multi-Agent Negotiation Protocol, International Journal on Autonomous Agents and Multi-Agent Systems, 8(1), 5--47, 2004 M.J. Bellosta, I. Brigui, S. Kornman, D. Vanderpooten « A multicriteria model for electronic auctions » SAC2004 (ACM Symposium on Applied Computing), pp759-765, 2004 S. Aknine, M.J. Bellosta, S. Kornman, S. Pinson. « A Many-to-Many Negociation Protocol for Electronic Commerce with Risk Commitment Strategies » The Fifth International Conference on Electronic Commerce Research (ICECR-5), Montreal, Canada October 23-27, 2002. N. Bredeche, Y. Chevaleyre, L. Hugues. « Wrapper for Object Detection in an Autonomous Mobile Robot » Proceedings of the IAPR's Sixteenth International Conference on Pattern Recognition 2002. Quebec City, Canada. N. Bredeche, Y. Chevaleyre. « Physically grounding the lexical semantics of words in a robot visual perception » Proceedings of the Seventh International Symposium on Artificial Life and Robotics for Information Technology 2002. Oita, Japan. N. Bredeche, J-D Zucker, Y. Chevaleyre. « A Wrapper-based Approach to Robot Learning Concepts from Images » Proceedings of the Seventh Pacific Rim International Conference on Artificial Intelligence 2002. Tokyo, Japan. P. Caillou, S. Aknine, & S. Pinson, « A Multi-Agent Method for Forming and Dynamic Restructuring of Pareto Optimal Coalitions » First International Joint Conference on Autonomous Agents and Multi-Agent Systems (AAMAS 02), Bologne, Italie, ACM Press, 1074-1081. P. Caillou, S. Aknine, & S. Pinson « Multi-Agent Models for Searching Pareto Optimal Solutions to the Problem of Forming and Dynamic Restructuring of Coalitions » European Conference of Artificial Intelligence (ECAI 2002), Lyon, France, IOS Press, 13-17. P. Caillou, S. Aknine, & S. Pinson « How to Form and Restructure Multi-agent Coalitions » National Conference on Artificial Intelligence (AAAI 02) Workshop on Coalition Formation, Edmonton, Canada, AAAI Press, 32-37.
S. Aknine and S. Pinson « Managing Distributed Parallel Workflow Systems Using a Multi- Agent Method » Yiming Ye and Elizabeth Churchill (eds.), Agent Supported Cooperative Work, Kluwer, 2002. Y. Chevaleyre , N. Bredèche, J.-D. Zucker. « Learning Rules from Multiple Instance Data : Issues and Algorithms » Proceedings of the 9th International Conference on Information Processing and Management of Uncertainty in Knowledge-Based Systems 2002. Annecy, France. M. Grundstein, C. Rosenthal-Sabroux et A. Pachulski Reinforcing Decision Aid by Capitalizing on Company’s Knowledge: Future Prospects., EJOR, European Journal of Operational Research Revue EJOR, European Journal of Operational Research, Volume 145, number 2, March 1, 2003, pp.256-272. M. Grundstein, C. Rosenthal-Sabroux Three Types of data for extended company’s employees: a knowledge management viewpoint:. annales n°1, décembre 2002, P173-191. C. Cauvet, C. Rosenthal-Sabroux Ingénierie des systèmes d’information, chez Hermès janvier 2001 M. Grundstein et C. Rosenthal-Sabroux Vers un système d'information source de connaissances p. 317-348 dans Ingénierie des systèmes d’information paru chez Hermès 2001. N.Kettani, P. Paré, D. Mignet et Camille Rosenthal-Sabroux DE MERISE à UML chez Eyrolles 2002.
Vous pouvez aussi lire