SAP HANA: note de synthèse
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
SAP HANA: note de synthèse Préface: Au cœur des nombreux défis que doivent relever les entreprises, l’informatique se doit de soutenir les évolutions, d’aider au développement de nouveaux avantages concurrentiels tout en traitant un volume d’informations de plus en plus important avec des délais très courts. Afin de répondre à ces besoins l’Editeur SAP propose avec HANA une ‘révolution’ dans la manière d’appréhen- der les bases de données • Traitement plus efficace de forts volumes de données avec une réduction du TCO • Simplification des architectures de type datawarehouse centralisés • Capacité à disposer de modèles analytiques en temps réel Après un phase dans laquelle seules les entreprise avant-gardistes ont adopté SAP HANA, nous entrons dans une seconde phase dans laquelle le niveau de maturité de la solution ayant fortement progressé ,Il n’existe maintenant plus de freins majeurs à un déploiement massif dans les entreprises tant pour les environnements décisionnels que les environne- ments de type ERP. Il est toutefois bon de se rappeler que bien que SAP ait ouvert la solution HANA à la virtuali- sation, celle-ci est incomplètement supportée et il existe encore des limites dans la capacité de convertir les tables en lignes en tables en colonnes. Nous vous proposons de découvrir dans cette note les principes de fonctionnement de SAP ’HANA et de vous donner un aperçu des changements que cela peut engendrer dans le contexte de l’héberge- ment et de l’administration SAP. Nicolas Conan Responsable offre hébergement ERP
SAP HANA: note de synthèse Les deux moteurs partagent une même couche mé- Notions de base : moire la « persistence layer » permettant le passage La partie SAP HANA Database est illustrée en tant que vers la couche de stockage permanente notamment des "system" dans les schémas suivants et l'ensemble de ce logs (stockage sur mémoire flash, non volatile et rapide). document. Un moteur de calcul «Calculation engine » vient en sup- Le system est composé à minima d’une zone de stock- plément afin d’intégrer la logique métier au niveau data- age partagé (Shared Storage), et d’une instance portée base plutôt que par passage des données vers l’applica- sur un hôte tion qui entrainerait des temps de latence Dans une version distribuée, le ‘’system’’ peut être com- En complément viennent s’ajouter la couche MDX posé de plusieurs instances (même numéro d’instance (Extension Multi-dimensionnel du SQL) et SQL Script sur l’ensemble des hôtes) partageant tous la Shared (ce dernier est une extension du SQL traditionnel Storage Configuration sur un hôte simple Architecture logique : La database représente une partie de l’ensemble SAP HANA Appliance et repose sur deux moteurs : • Le premier se charge des données agrégées de type colonne (column store) et participe aux opé- rations de type analytique. Configuration multi hôtes • Le second se charge des données traditionnelles Chaque hôte peut être configuré comme ac f (ac ve host) ou de type ligne (row store) moteur de type tradition- en passif (standby host) nel
SAP HANA: note de synthèse La participation de plusieurs hôtes répond aussi bien à Des points de sauvegarde sont réalisées par défaut des problématiques d'équilibrage de charge que de bas- toutes les 5 minutes culement en cas de panne (fail over); de fait on peut clas- ser les systèmes par le dimensionnement de leur archi- tecture comme les exemples ci-dessous : Compression des données Performances: Mémoire et problématique de la persistance: L’utilisation en mémoire ne remet pas en cause les prin- cipes d’atomicité, consistance, et d’isolation inhérents aux SGBD de façon générale mais remet en cause celui de la durabilité. Une panne de courant sur un support volatile se traduit La compression de données est assurée par la normalisa on par une perte de données. du modèle de données et le stockage en colonne. Le découplage d’une table en trois ensemble, avec ici custo- mer et material permet d’obtenir 2 index dis ncts par cons- truc on et diminuer l’u lisa on mémoire de la table princi- pale dans laquelle on retrouve les ID des index qui recons - tuent l’informa on. Normalisa on du modèle "En apparence on injecte de la complexité dans le mode de stockage, mais les principes de normalisa on des modèles de données sont mieux respectés et le volume de données est réduit ainsi que les temps d’accès Stockage en colonnes Afin d’éviter ce problème, les logs sont écrits sur un sup- port persistant (non volatile) à intervalle régulier de sorte à pouvoir garantir la remontée de la base au niveau de ce qu’elle était avant crash et assurer la persistance.
SAP HANA: note de synthèse Cette normalisation s'est accompagnée d'un effort de Prérequis installation recodage et d'optimisation important mené par SAP La recherche des enregistrements ayant le customer 4 et Licences Material 3 se trouve accélérée par les opérations bit à bit. Ce type d’opération étant particulièrement rapide, il justi- SAP fournit des licences temporaires mais recommande fie pleinement l’apparente complexification du mode de d’installer une licence permanente et ce dans tous les stockage. cas avant la date d’expiration de la License temporaire. La mise à jour ou insertion de données bénéficie d'un Matrice de disponibilité produit SAP gain de performance moindre, uniquement liée à l’accélé- ration de l'accès au support, mais aussi au profit d’une SAP HANA utilise surtout la mémoire, depuis 128Gb plus grande rapidité d’accès à l’information une fois (24Gb pour une base de test) jusqu’à plusieurs Tb stockée. D’une manière générale si 4X Go représente la taille du Logique applicative intégrée volume de données, il faut compter : La séparation de la logique applicative de la couche base • X Go de taille pour le volume de logs de base de de données induit une dépendance au niveau de la rapi- données dité du réseau pour extraire, transformer et retourner les données. Dès lors que la database est pensée pour fonc- • X Go de mémoire physique tionner en temps réel (mémoire volatile), la vitesse du réseau devient potentiellement significative au regard des Matrice officielle de compatibilité SAP (PAM) à l’adresse temps mémoire pour justifier l’intégration de la logique suivante http://global.sap.com/community/ebook/2014-09 applicative au niveau du serveur de base de données. -02-hana-hardware/enEN/index.html C'est pourquoi SAP préconise l'installation des ap- Prérequis logiciel pliances SAP HANA DB dans le contexte de réseau 10G- bit/s Il est recommandé que le software SAP HANA soit instal- lé par un partenaire hardware certifié ou toute personne Parallélisassion et partitionnement ayant obtenu la certification E_HANAINS131. Plutôt que de confier une masse de travail lors d’une re- Ne rien installer qui sorte des matrices de compatibilité quête à un cœur de CPU, on divise la tâche en plusieurs au niveau software sur les systèmes SAP HANA sous requêtes indépendantes réparties sur plusieurs Système d’exploitation pour SAP HANA cœurs de sorte à réduire le temps de traitement global. Au delà des limites d’un seul serveur, la base de don- • SUSE Linux Enterprise Server (SLES) 11 SPA, SP2 nées peut être répartie sur plusieurs serveurs au travers • RedHat (Red Hat Enterprise Linux (RHEL) 6.5 d’un cluster ce qui permet d’aller vers l’architecture distri- buée décrite plus tôt. L’exploitation des column tables sur des partitions séparées permet du aussi a répartition des Les deux suites logicielles sont déclinées dans des ver- ressources. sions adaptées à HANA avec des niveaux de support à même de couvrir l’exigence d’un environnement de pro- duction avec des coûts de licences associés. Tous les logiciels qui interagissent avec les systèmes HANA ou nécessitant des agents doivent aussi être certi- fiés (outil de surveillance, outil de sauvegarde…). D’une façon générale, toute brique logicielle pouvant avoir une influence sur l’utilisation du disque, du CPU ou de la mémoire, nécessite, pour être certifié, d’être testé par SAP dans les différents cas d’utilisation de SAP HA- NA.
SAP HANA: note de synthèse SAP HANA dans votre data centre SAP HANA et la virtualisation SAP HANA Studio A ce jour, il existe des limitations dans ce que SAP sup- Une nouvelle console d’administration : Le HANA Studio. porte en termes de déploiement de HANA dans des envi- ronnements virtualisés. Base matérielle La sortie du SP7 de HANA DB a néanmoins élargi les frontières de l’utilisation en environnement virtualisé. Un jeux de base matérielle limité est autorisé à faire tour- ner des machines virtuelles afin d’héberger HANA. Il se base sur : Elle ce limite aux CPU de type Intel Xeon E7 et E5 (IBM Power 7+ prévu mais non validé à fin Novembre 2014) Machines virtuelles L’utilisation de VMs est ouvertes à l’ensemble des sys- HANA Studio tourne sur une plateforme de développe- tèmes non productifs, mais reste contrainte pour les sys- ment JAVA Eclipse. tèmes productifs a quelques configuration restreintes. Dans le cadre de l’administration, cette application couvre les tâches d’administration comme l’ar- rêt/démarrage des instances de bases de données, leur configuration comme la gestion des autorisations, la pla- nification et le suivi de l’exécution de celles-ci, l’utilisation des ressources systèmes, et plus globalement le monito- ring de l’activité des bases HANA. MCOS : Multiple components on one System Evolutions Bien qu’HANA Studio soit préférable pour la configuration des instances de bases de données, une fois la mise en La feuille de route de SAP prévoit les évolutions vers le œuvre réalisée, la base HANA peut se greffer au pay- complément de gamme VmWare en 2015, en particulier sage applicatif géré avec Solution Manager. Cela permet avec la gestion des cluster vSphere et la certification de un suivi intégral du ou des paysages applicatifs des vSphere 6 ainsi que l’extension continue des bases ma- suites SAP déployés dans un contexte donné. térielles à même de supporter HANA avec comme direc- Les échanges entre HANA Studio et la base de données tion principale la volonté de favoriser l’accroissement se font au travers du langage SQL. d’échelle par la démultiplication des hôtes.
Vous pouvez aussi lire