L’art d’élaborer des modèles de données performants

Publié le 30 mars 2022
par Kim Leblanc

L’art d’élaborer des modèles de données performants

Tout projet d’intelligence d’affaires (avec Excel, PowerBI ou n’importe quel outil), repose sur la qualité des données utilisés et du modèle de données en place. Avant de se lancer dans un projet d’intelligence d’affaires, on doit s’assurer que le modèle de données répondra adéquatement aux besoins qui ont été l’élément déclencheur dudit projet sans sacrifier sa performance.

Par exemple, si votre projet repose sur l’analyse des ventes de votre entreprise, votre modèle de données doit être réfléchi et construit de façon à permettre le forage par région, par vendeur, par catégorie de produits, etc.

DrillDown

Avant de maîtriser complètement la création de modèles de données, plusieurs auront le réflexe de créer une seule table de données par la fusion de plusieurs tables dans Power Query. Si on retourne à notre exemple d’analyse des ventes, il s’agirait de construire une table qui contient toutes l’information nécessaire à l’analyse (en colonne) pour toutes les factures de ventes (en ligne). C’est une méthode qui fonctionne bien en théorie mais qui a ses limites! Dès que les données se complexifient ou augmentent en volume, cette option devient rapidement non viable.

 

Pour maximiser la performance de nos rapports, il est important de toujours avoir la performance du modèle de données en tête. Voici quelques pratiques incontournables pour optimiser la performance :

  • Normaliser les données (jusqu’à un certain point)
    • Éliminer la répétition de champs qui contiennent des données semblables (Ex : Mois présentés en colonnes plutôt qu’en lignes)
    • Créer des tables distinctes pour stocker les « caractéristiques » d’une donnée (Ex : Couleur, taille, poids d’un article)
    • Éliminer les champs qui ne dépendent pas de la clé primaire. Lorsque le contenu peut s’appliquer à plusieurs enregistrements d’une table, déplacer vers une autre table.
    • Limite : la présence de nombreuses petites tables peut diminuer les performances. Il faut trouver le juste milieu entre avoir des données dénormalisées et trop normaliser les données.
  • Modéliser adéquatement les données
  • Gérer les cas complexes (Ex. : Plusieurs tables de faits)
  • Utiliser les relations appropriées entre les tables
    • Plusieurs à un
    • Plusieurs à plusieurs

Modèle de données

 

Le 19 avril dernier, je vous ai présenté un webinaire sur « L’art d’élaborer des modèles de données performants » . Pour écouter l’enregistrement de ce webinaire, devenez simplement membre VIP.

 


Fichier d’accompagnement VIP à télécharger

Pour télécharger le fichier utilisé dans ce tutoriel, devenez membre VIP du CFO masqué.

Écoutez notre webinaire en différé

Pour écouter ce webinaire en différé devenez membre VIP du CFO masqué.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.

Scroll to Top