J’ai Ă©tĂ© la premiĂšre Ă offrir des formations Power BI Ă MontrĂ©al (et longtemps la seule), de sorte que j’ai formĂ© un nombre impressionnant d’usagers. La grande majoritĂ© des professionnels Ă qui j’ai enseignĂ© et la grande majoritĂ© des professionnels Ă qui j’enseigne en ce moment sont d’abord et avant tout des usagers d’Excel et ont peu ou pas d’expĂ©rience en modĂ©lisation de donnĂ©es ou avec d’autres solutions d’intelligence d’affaires. La plupart ont Ă©galement l’impression qu’apprendre Power BI se fera sans casser des oeufs et qu’ils deviendront autonomes trĂšs rapidement. Cet article a pour but de vous donner l’heure juste sur l’apprentissage de Power BI, surtout si vous ĂȘtes prĂ©sentement des usagers Excel. N’allez pas penser que je souhaite vous dĂ©courager, bien au contraire! Power BI est une solution extraordinaire, qui est en train d’ĂȘtre implantĂ©e dans de nombreuses entreprises et c’est tant mieux! Je suis ravie de voir l’enthousiasme des entreprises pour cette solution extraordinaire de Microsoft. Cet article a simplement pour but de mieux calibrer vos attentes et d’attirer votre attention sur les erreurs Power BI les plus courantes que j’ai observĂ©es chez les dĂ©butants, justement de façon Ă faciliter votre apprentissage et vous permettre de bĂ©nĂ©ficier pleinement de la solution.
Cet article fait suite Ă l’article Power BI: 15 erreurs courantes chez les dĂ©butants (1 de 3).
#6 Ne pas chercher Ă optimiser les requĂȘtes
Les dĂ©butants en Power BI ont tendance Ă ne pas saisir complĂštement l’aspect “performance” des requĂȘtes. Ce faisant, lorsqu’ils Ă©crivent des requĂȘtes dans l’Ă©diteur Power Query, ils ne cherchent pas Ă les optimiser, i.e. Ă rĂ©duire au minimum les Ă©tapes appliquĂ©es. Ils peuvent, par exemple, utiliser 10 Ă©tapes appliquĂ©es (et donc 10 lignes de code, ayant chacune sa lourdeur) pour effectuer une transformation de donnĂ©es qui pourrait ĂȘtre effectuĂ©e en une seule Ă©tape. Ceci constitue une grave erreur dans Power BI. S’il est vrai que plus l’Ă©diteur de requĂȘtes Ă©volue, moins il devient essentiel de maĂźtriser le langage M, je suis d’avis qu’une connaissance de base minimum du langage M permettra d’amĂ©liorer significativement la performance des requĂȘtes.
De mĂȘme, il faut se questionner sur les sources de donnĂ©es auxquelles on se connecte. Devrait-on se connecter en mode d’importation de donnĂ©es? En mode de connexion directe? Ou encore avec via les nouveaux modĂšles composites? Devrait-on se connecter Ă la base de donnĂ©es complĂšte? Ă une vue? Devrait-on rĂ©diger une requĂȘte SQL dans la requĂȘte d’importation? Les dĂ©butants en Power BI ont tendance Ă ignorer ces questions et peuvent donc ĂȘtre confrontĂ©s Ă des problĂšmes de performance importants.
Modes de connexion aux données sources
#7 Effectuer des transformations dans la source de données
Certains dĂ©butants en Power BI ne profitent pas assez de la flexibilitĂ© de l’Ă©diteur de requĂȘtes. Ce faisant, ils apportent encore des changements manuels Ă leurs donnĂ©es sources, avant de les importer dans Power BI, au lieu de laisser l’outil travailler pour eux et automatiser le processus Ă chaque mise Ă jour des donnĂ©es. Ceci est une erreur impardonnable avec Power BI.
Par exemple, j’ai vu un apprenant qui devait consolider des donnĂ©es provenant de fichiers hebdomadaires. Chaque semaine, il recevait par courriel un fichier, qui reprĂ©sentait les donnĂ©es de la semaine. Et tous ces fichiers comprenaient un onglet avec un nom diffĂ©rent. Ce faisant, il modifiait manuellement les noms de ces onglets, avant de les enregistrer, afin qu’ils aient tous le mĂȘme nom et puissent ainsi ĂȘtre importĂ©s via l’option “Dossier”. Avec une connaissance minimale du langage M, il n’aurait pas eu Ă faire de telles modifications.
Voici un article Ă ce sujet: Excel : Fusionner des fichiers avec des noms dâonglets diffĂ©rents Ă lâaide de Power Query
#8 Faire des calculs dans la source de données
Plusieurs dĂ©butants en Power BI ont aussi tendance Ă faire une bonne partie, voire tous leurs calculs, dans les sources de donnĂ©es. D’abord, il faut savoir que cela peut affecter la performance (voir point #10) mais en surcroĂźt, cela peut aussi crĂ©er des problĂ©matiques additionnelles. Il s’agit d’une erreur Power BI Ă Ă©viter Ă tout prix.
Par exemple, ci-dessous, un cabinet comptable a ajoutĂ© une colonne dans ses donnĂ©es sources pour calculer le taux de rotation des stocks de chacun de ses clients et cela sur deux annĂ©es. Cela peut permettre de crĂ©er quelques visualisations comme le taux de rotation moyen par client ou le taux de rotation moyen par annĂ©e. Par contre, qu’adviendra-t-il quand le cabinet voudra comparer l’Ă©cart entre le taux de rotation des stocks du client A avec la moyenne des taux de rotation des stocks est autres clients?
Je suis d’avis qu’il est absolument essentiel de maĂźtriser les bases du langage DAX pour crĂ©er des rapports pertinents dans Power BI. Et un des concepts qu’il faut maĂźtriser, c’est ce que l’on appelle en anglais le Measure branching oĂč chacune des mesures de notre modĂšle de donnĂ©es dĂ©coule d’une autre mesure. Par exemple, on fera:
- Une mesure pour obtenir les ventes (et si la colonne ventes n’existe pas, on n’aura pas besoin de la crĂ©er, on pourra utiliser une fonction itĂ©rative comme le SUMX par exemple)
- Une mesure pour les coûts
- Une mesure pour les marges (mesure ventes moins mesure coût)
- Une mesure pour les marges en % (mesure marges divisée par mesure ventes)
- Imaginez ici un instant que vous n’ayez pas calculĂ© les mesures prĂ©cĂ©dentes, la mesure pour les marges en % serait alors plus complexe Ă Ă©crire
- Pire encore, imaginez que vous ayez inséré la formule dans une colonne calculée dans la source⊠pour obtenir le total, vous feriez la somme des % de marges, ce qui fournirait un résultat erroné
- Le fait de crĂ©er une hiĂ©rarchie de mesures rend le modĂšle trĂšs souple et facile Ă dĂ©boguer, le cas Ă©chĂ©ant en plus de permettre d’effectuer des calculs justes
Plus prĂ©cisĂ©ment, avec nos donnĂ©es d’inventaire, on pourrait crĂ©er la hiĂ©rarchie de mesures suivante, qui est trĂšs simple:
Ceci nous permettrait de pouvoir comparer aisĂ©ment le taux de rotation d’un client vs le secteur et ce, pour l’ensemble des annĂ©es.
#9 Ne pas saisir l’importance du contexte de filtres
Certains dĂ©butants ont bien compris l’importance de la normalisation de donnĂ©es et du langage DAX mais ne maĂźtrisent pas ce que l’on appelle le contexte de filtres des rapports. Voici par exemple ce que j’ai vu chez un client. Celui-ci a construit un rapport complet qui comparait les donnĂ©es de 2017 vs 2016. Ses donnĂ©es sources comprenaient bel et bien une colonne AnnĂ©e. Il avait donc bien normalisĂ© ses donnĂ©es. Il avait aussi utilisĂ© le langage DAX pour crĂ©er ses mesures, mais ne saisissant pas trĂšs bien le contexte de filtres, il a procĂ©dĂ© de la façon suivante:
- Ventes 2016 = CALCULATE ([Ventes], Ventes[AnnĂ©e]=”2016″)
- Ventes 2017 = CALCULATE ([Ventes], Ventes[AnnĂ©e]=”2017″)
- Ăcart Ventes 2017-2016 = Ventes 2017 – Ventes 2016
Quel est le problÚme avec cette procédure à votre avis?
Et bien, quand est venu le mois de janvier 2018, le client, pris de panique, m’a passĂ© un coup de fil: “Mais c’est l’enfer Power BI! Tous nos rapports sont Ă refaire et comme c’est lĂ , ils seront Ă refaire chaque annĂ©e!”. N’ayant pas considĂ©rĂ© le contexte de filtres et n’ayant pas profitĂ© des mesures de Time Intelligence en DAX, mon client se trouvait effectivement dans un fichu pĂ©trin. Il devait maintenant recrĂ©er toutes ses mesures pour 2018 et refaire ses visualisations. Cette approche, je l’ai observĂ©e chez plusieurs dĂ©butants, qui s’en sont mordus les doigts par la suite! C’est une erreur trĂšs courante auprĂšs des dĂ©butants dans Power BI.
#10 Ne pas optimiser pour la performance
Power BI repose sur un engin qui compresse les donnĂ©es en colonnes. Ce faisant, il est primordial de normaliser les donnĂ©es. Il faudrait toujours viser Ă ce que les tables de faits ne possĂšdent que les valeurs Ă analyser et des clĂ©s pour crĂ©er des relations avec les tables de dimensions. Rien d’autre. Comme il est plus facile de compresser des nombres que du texte, et comme les tables de faits sont les tables les plus volumineuses d’un modĂšle de donnĂ©es, le respect de cette rĂšgle sera trĂšs profitable au niveau de la performance.
De mĂȘme, les dĂ©butants ont tendance Ă importer beaucoup trop de donnĂ©es (trop de colonnes), comme s’il ne serait plus possible, par la suite, d’ajouter de nouvelles colonnes au besoin. Ceci a un effet direct sur la performance.
Ne manquez pas la suite de cet article: Power BI: 15 erreurs courantes chez les débutants (3 de 3).
Formation complémentaire
Pour débuter votre apprentissage sur ce bonnes bases, inscrivez-vous à notre formation Power BI (niveau 1).
Voici quelques commentaires d’apprenants ayant suivi cette formation :
Bonjour Sophie,
Merci pour ces prĂ©cieux conseils qui Ă©viteront une perte de temps certaine, l’apprentissage de power BI Ă©tant dĂ©jĂ consĂ©quent pour en maĂźtriser les bases productives.