Comment fonctionnent et à quoi servent les bases de données OLAP?

Publié le 29 mai 2014
par Sophie Marchand M.Sc.
ROLAP

Si vous êtes de ceux qui n’ont toujours pas une idée claire de ce que sont les bases de données OLAP (Online analytical processing) et de leur utilité dans un projet de reporting et/ou de tableau de bord, je vous invite à consulter l’article suivant.

 

Bases de données OLAP: La base

Les bases de données OLAP, auxquelles on réfère souvent via le terme “Cubes OLAP” permettent de regrouper les données par “dimensions”. Les analyses, les rapports et les tableaux de bord conçus à partir de bases de données OLAP permettent aux utilisateurs de répondre à plusieurs questions à partir d’une seule composante (graphique, tableau, etc.), en sélectionnant les dimensions voulues. Elles offrent donc de la performance et de la flexibilité.

Dans les bases de données OLAP, on parle de « mesures » lorsqu’on réfère à des items mesurables (montants ou quantités) et on parle de “dimensions”, lorsqu’on réfère à un regroupement de mesures. Une “dimension” peut, par surcroît, comprendre une hiérarchie ou de multiples hiérarchies, ce qui permet le forage éventuel des données. Par exemple, on pourrait chercher à obtenir le nombre total d’employés, et ensuite obtenir le résultat par année d’embauche, par trimestre, par mois ou carrément par journée. La séquence de « Années » à « Trimestres » à « Mois » à « Jour » est une hiérarchie de la dimension date d’embauche (c’est la piste de forage!) et « Années » est un membre de la dimension date d’embauche

 

Bases de données OLAP : Les avantages

Un des bénéfices des bases de données OLAP est de permettre aux usagers d’analyses, de rapports et de tableaux de bord, conçus à partir de ces bases de données, la capacité de voir l’information analysée sous divers angles. On parle généralement de:

  • « Drill up/Drill down »: les usagers peuvent voir les données de façon plus ou moins regroupée
  • « Drill across » : les usagers peuvent se promener d’une dimension à une autre (par exemple, ils peuvent regarder le total des ventes par client et ensuite regarder les produits vendus à l’un de ces clients).
  • « Drill through »: les usagers peuvent creuser jusqu’à la transaction dans le système relationnel de base

 

Bases de données DOLAP : Desktop OLAP

L’usager final télécharge la base de données (habituellement dans Excel) et construit des tableaux croisés dynamiques et des tables de données, directement sur son poste de travail. Les tableaux croisés dynamiques permettent de filtrer et de forer dans toutes les dimensions. Le forage peut se faire jusqu’au niveau de la transaction. La base de données peut être copiée dans Excel manuellement, via des macro-commandes VBA ou encore via certains Add-Ins comme PowerPivot. Dans tous les cas, il faut savoir bien organiser ses données afin de concevoir des tableaux et des graphiques qui répondent aux objectifs du tableau de bord et aux besoins d’information. Il faut aussi prévoir en fonction de la croissance éventuelle de l’entreprise. Il peut donc être utile de se lancer à petite échelle avec des données locales avant d’enclencher un plus gros projet et de se créer ainsi un prototype, qui pourra être raffiné et renforcé au fil du temps. À cet effet, je vous invite à relire l’article sur le BISM de Microsoft.

 

Bases de données ROLAP: Relational OLAP

Pour obtenir une « R »OLAP, il faut transformer une base de données relationnelle OLTP en schéma en étoiles. Un schéma en étoiles de base a une table simple de « mesures » (ou de faits) en son centre et les “dimensions” autour d’elle.

ROLAP

 

Les clés secondaires dimensionnelles sur cette table simple échangent avec les clés primaires de chacune des dimensions de la table, ce qui forme une étoile. Ce mode est utilisé surtout pour les besoins de forage jusqu’à l’unité transactionnelle. Par exemple, pour une cie manufacturière, la dimension « PRODUITS » peut contenir des milliers de SKUs.

ROLAP

 

Les données restent dans la BD et des tables d’agrégation sont créées à même la BD. La BD est sollicitée à chaque relance. Si une dimension a plusieurs attributs, elle devrait résider dans une ROLAP.

ROLAP

 

Les attributs peuvent également être utilisés dans des requêtes. Par exemple, on pourrait rechercher les ventes totales de tous les clients en Californie. Cette requête fait un filtre sur la dimension client et sur l’attribut région.

 

Bases de données MOLAP: Multi-dimensional OLAP

La base de données MOLAP est similaire à ROLAP et elle est basée sur des dimensions et des mesures. Pour la construire, on va utiliser des scripts d’aggrégation. La différence majeure est au niveau de  l’entreposage des données:

  • MOLAP emmagasine les résultats dimensionnels agrégés alors que ROLAP emmagasine les tables de dimensions et de mesures
  • MOLAP a tendance à regrouper les données à un niveau supérieur et utilise plus efficacement l’espace du disque dur
  • Les données sont stockées dans un cube (BD multidimensionnelle), dans une structure indépendante
  • Tous les croisements possibles sont ainsi pré-calculés

 

Bases de données HOLAP: Hybrid OLAP

La base de données HOLAP s’appuit avantageusement sur les technologies ROLAP et MOLAP. Elle offre la grande performance et les attributs complexes de MOLAP, avec l’habilité de faire du forage à un niveau beaucoup plus bas de transactions, comme le fait ROLAP. Les données de base restent dans la BD et le cube crée des structures pour les agrégations.

 

CFO-Masque_Formations-en-ligne_FBLa mission du CFO masqué est de développer les compétences techniques des analystes et des contrôleurs de gestion en informatique décisionnelle avec Excel et Power BI et favoriser l’atteinte de leur plein potentiel, en stimulant leur autonomie, leur curiosité, leur raisonnement logique, leur esprit critique et leur créativité.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Retour en haut