;
chevron-bottomchevron-leftchevron-rightdownloadfacebookinstagramlink-outlinkedinminusplus
Accessibilité Tous les articles

SAP HANA - Ce que vous devez savoir sur cette nouvelle base de données

Publication

Mars 2012

Publié par

Pierre-Luc Gendron

Restez à l’affût des dernières tendances analytiques

Avec le temps, plusieurs entreprises ont constaté que la quantité de données grandissait de façon impressionnante. Donc, il devient de plus en plus crucial pour les organisations d'obtenir l'information rapidement tout en assurant une mise à jour des données les plus récentes. Malheureusement, ces deux éléments sont difficilement conjugués. Il est donc nécessaire de faire des compromis. C'est en tentant de répondre à ces enjeux que SAP a créé HANA, leur nouvelle technologie de base de données en mémoire.

Afin de mieux comprendre ce qu'est HANA et comment cet outil offre la solution à cette problématique, nous ferons un résumé de l'atelier privé ayant été organisé le 22 février, à Québec.

Ce blogue sera divisé en 2 parties:

  • Qu'est-ce que HANA?
  • Pourquoi ai-je besoin de HANA?


Qu'est-ce que HANA?

Comme il est spécifié plus haut, HANA est un engin de base de données en mémoire. Cela signifie que l'outil ne conserve aucune donnée sur disque comme les systèmes conventionnels. En procédant de la sorte, l'ensemble des traitements, des requêtes et des transformations s'effectuent beaucoup plus rapidement. Cette augmentation de vitesse s’explique par le fait que les tâches en mémoire s’exécutent en nanosecondes, contrairement aux traitements sur disque qui s’exécutent en millisecondes. Afin d'assurer une conservation en cas de pannes, l'outil contient une couche de persistance, permettant une conservation depuis la dernière sauvegarde. Cette couche de persistance est essentiellement un log contenant les différents éléments créés dans l’outil, comme un modèle de données.

Également, HANA intègre HANA studio qui offre une interface visuelle pour la modélisation des différentes bases de données en mémoire, pour l'écriture et l'exécution de requêtes SQL, etc. HANA studio offre également une gamme d'outils permettant une analyse rapide des données en entrées, ce qui fera le grand bonheur des développeurs ETL et des modélisateurs au sein des organisations.


Pourquoi ai-je besoin de HANA?

L'avantage majeur lié à l'utilisation de HANA est la rapidité de l'ensemble des traitements. Dans une stratégie BI conventionnelle, le processus ETL est la portion où le plus de temps et d’efforts sont dépensés, et ce, en raison de la quantité de traitements imposés à l'outil. Avec HANA, notre approche du ETL pourra être modifiée, en passant au ELT, soit extraction, chargement et traitement. De cette façon, la charge des traitements sera imposée à HANA, qui fera ses traitements en mémoire, plutôt qu'à notre outil ETL. Inutile de mentionner que le gain de performance est considérable, surtout lorsque beaucoup de transformations sont apportées aux données.

De plus, la quantité de données pouvant être traitées avec HANA est un avantage considérable. Avec sa technologie en mémoire, HANA effectue une compression des données utilisées par l'outil de l'ordre de 1 pour 5. Donc, si vous utilisez un ensemble de données d'une taille d'un téraoctet sur disque, l'espace réel qui sera utilisé au sein de HANA sera de 200 gigaoctets.

Il est donc possible d’illustrer que le compromis entre la quantité de données et la rapidité des traitements à effectuer est de moins en moins vrai avec HANA.

Dans le prochain billet, nous traiterons plus en détail de l'utilisation de cet outil et comment il pourrait s'intégrer dans votre organisation.