Découvrez l’entrepôt virtuel de Fabric et sa simplicité d’utilisation

Publié le 06 février 2024
par Kim Leblanc BAA
Entrepôt virtuel de données Fabric de Microsoft

Dans notre série d’articles dédiée à  l’environnement de Microsoft Fabric, je vous ai fait un résumé des différentes composantes puis j’ai détaillé les 2 premières : Data Factory et  Synapse Data Engineering.

Parlons maintenant de la composante Entrepôt virtuel de données (Data Warehouse).

 

Qu’est-ce que l’entrepôt virtuel (Synapse Data Warehouse) de Fabric ?

Il s’agit d’un entrepôt de données qui peut contenir des données de presque n’importe quelles sources.

Pour intégrer ces données, 4 options sont offertes :

  1. Les pipelines : ils permettent de suivre une séquence bien définie pour l’importation
  2. Les flux de données : une alternative au pipeline qui permet de se connecter à une source et d’effectuer quelques transformations au passage.
  3. La commande COPY (Transact SQL) : elle permet d’ingérer des données à haut débit.
  4. Interrogation de bases de données croisées (Cross-warehouse ingestion) : où l’on pourrait par exemple chercher des données à partir d’un espace de travail Power BI.

Microsoft annonce l’entrepôt comme étant d’utilisation facile autant par le « Power User » que par un administrateur de base de données, un ingénieur de données ou un développeur professionnel.

Mais qu’en est-il réellement ?

Passons à travers le processus de création de l’entrepôt et de son utilisation pour voir ce qu’il en est.

 

Différence entre un Lakehouse et l’entrepôt

Avant de commencer, j’aimerais faire une distinction entre le Point de terminaison SQL du Lakehouse dont je vous ai parlé dans cet article MS Fabric : Gérez vos données avec Synapse Data Engineering et l’entrepôt de données.

Pour le Point de terminaison SQL du Lakehouse, on parle alors d’un entrepôt qui a été généré automatiquement à partir d’un Lakehouse. Il s’agit d’une vue qui est en lecture seule, on ne peut donc pas à cet endroit ajouter des données. Il faudrait alors passer à la vue Lakehouse pour effectuer des ajouts ou modifications. Il sera possible d’utiliser les scripts SQL pour interroger les données uniquement.

D’un autre côté, l’entrepôt permet d’utiliser les transactions T-SQL pour créer des tables, des vues, des procédures stockées et de gérer les données comme on le ferait dans un entrepôt de données de type « traditionnel ».

Alors que le Lakehouse et son point de terminaison seraient plutôt dédié à des ingénieurs de données, l’entrepôt serait quant à lui propice à l’utilisation par le «Power User » ou si vous préférez le développeur citoyen.

Il sera possible d’utiliser SQL Server Management Studio (SSMS) ou Azure Data Studio pour la gestion de la base de données pour ceux qui préfère une expérience axée uniquement sur le langage T-SQL pour le traitement des données.

Remarquez que l’interface du Point de terminaison SQL du Lakehouse et celle de l’entrepôt sont identiques, facilitant l’apprentissage et la gestion des deux options.

 

1. Créer votre entrepôt Fabric

Il existe trois chemins pour créer un entrepôt.

 

Par la vue Data Warehouse

En sélectionnant cette option au bas à gauche de Power BI Service, vous pourrez cliquer sur la vignette Entrepôt.

 

Par l’option Créer dans le panneau de gauche de Power BI service

Il faudra ensuite cliquer sur la vignette Entrepôt. Vous n’avez alors pas besoin d’être dans la vue Data Warehouse. Ici, je suis passée pas la vue Power BI.

 

Par un espace de travail, et utiliser le menu + Nouveau

Vous pourrez choisir Plus d’options au bas du menu. Et finalement cliquer sur la vignette Entrepôt.

 

 

Dans tous les cas, la première étape sera de nommer votre entrepôt. Notez que vous ne pouvez pas utiliser des accents dans le nom de votre entrepôt et que cette étape peut prendre plusieurs secondes à s’exécuter.

Entrepôt Fabric de Microsoft

 

Vous pourrez voir votre Entrepôt dans votre Espace de travail

Entrepôt Fabric de Microsoft

 

Notez qu’un modèle sémantique a été créé par défaut et qu’il est lié à votre nouvel entrepôt.

 

2. Bâtir votre entrepôt virtuel

Comme mentionné précédemment, il est possible d’intégrer des données de différentes façons dans votre entrepôt.

Lorsque vous sélectionnez votre entrepôt, vous avez des suggestions pour préparer ce dernier. Vous pouvez utiliser T-SQL, un flux de Gen 2 (différent du flux régulier de power BI service par le fait de pouvoir charger les résultats du flux dans votre entrepôt) ou un pipeline de données.

Voir l’article suivant pour plus de détails sur les flux de 2e génération et les pipelines de données puis connaitre les étapes de création de ces derniers : Microsoft Fabric : Intégrez vos données avec Data Factory

Entrepôt Fabric de Microsoft

 

Si vous choisissez la première vignette T-SQL, vous pourrez alors commencer par créer vos tables tout comme vous le feriez avec SSMS en utilisant le langage SQL.

Entrepôt Fabric de Microsoft

 

On vous propose alors un exemple de code à utiliser pour créer une table.

Vous avez d’autres modèles de code dans le menu Nouvelle requête SQL.

Entrepôt Fabric de Microsoft

 

Voici, entre autres, le modèle pour créer une Procédure Stockée.

Entrepôt vistuel Fabric de Microsoft

 

Si vous voulez tester la solution sans recourir à vos données, utilisez la dernière vignette à droite pour utiliser un exemple de données. Vous aurez alors accès à un ensemble de tables pour expérimenter les différentes fonctionnalités de l’entrepôt.

Entrepôt vistuel Fabric de Microsoft

 

3. Interroger votre entrepôt

Vous avez toujours l’option des requêtes SQL pour interroger vos données comme mentionné précédemment.

Vous pouvez, entre autres, cliquer sur les 3 points (…) à droite de chacune des tables pour sélectionner les 100 premiers enregistrements de la table, supprimer ou créer la table. Ce qui générera le code SQL pour vous.

Entrepôt vistuel Fabric de Microsoft

 

Mais pour éviter d’avoir à écrire le code SQL, vous avez également la possibilité d’utiliser la Nouvelle requête visuelle afin de pouvoir glisser les différentes tables de données que vous souhaitez interroger.

Entrepôt Fabric de Microsoft

 

Puis, vous pouvez alors effectuer différentes transformations avec les menus qui ressemblent énormément à ce que vous avez dans Power Query (outil intégré dans Power BI pour transformer vos données). Si vous n’êtes pas familier avec le langage SQL, ici vous pourrez utiliser vos connaissances de Power Query pour visualiser vos données.

Vous voyez pour chacune des tables les différentes étapes de transformation.

Entrepôt Fabric de Microsoft

 

Vous pouvez utiliser les menus du haut pour effectuer des transformations, comme choisir les colonnes à afficher.

Entrepôt Fabric de Microsoft

 

Ou bien encore, fusionner des requêtes.

Entrepôt Fabric de Microsoft

 

Finalement, vous pouvez voir le code SQL généré par votre requête visuelle ou bien enregistrer le tout en tant que vue SQL.

La vue SQL sera alors accessible pour être utilisée dans vos rapports Power BI.

Entrepôt Fabric de Microsoft

 

4. Préparer votre modèle sémantique et créer vos rapports

Vous pouvez préparer votre modèle sémantique avec les tables de votre entrepôt.

C’est le même principe ici que si vous l’aviez fait dans Power BI Desktop. Vous créez vos liens entre vos tables puis vous pouvez ajouter des mesures.

Entrepôt Fabric de Microsoft

 

Vous pouvez enfin utiliser le bouton Nouveau rapport pour créer un rapport dans Power BI Service.

Entrepôt Fabric de Microsoft

 

En résumé, l’entrepôt de données dans Fabric vous permet d’emmagasiner vos données dans un environnement virtuel et de pouvoir facilement effectuer l’intégration, la gestion ainsi que l’interrogation de ces données.

Pour un utilisateur connaissant déjà Power BI, l’apprentissage peut effectivement se faire rapidement sans être un développeur de métier puisque l’interface et les options disponibles font référence à des fonctionnalités pour la plupart déjà connues sous Power BI.

 

Avez-vous consulté tous les articles de cette série sur Microsoft Fabric ?

Afin de recevoir nos nouveaux articles directement dans votre boite courriel, abonnez-vous à nos infolettres.

  1. Introduction à Microsoft Fabric, outil intégré pour l’analyse de données
  2. 3 étapes pour accéder à une version d’essai de Microsoft Fabric
  3. Accéder à OneLake directement par l’explorateur de dossiers Windows
  4. Microsoft Fabric : Intégrez vos données avec Data Factory
  5. Microsoft Fabric : Gérez vos données avec Synapse Data Engineering
  6. Découvrez l’entrepôt virtuel de Fabric et sa simplicité d’utilisation

 


Voici nos formations Power BI disponibles en français : Voici nos formations Power BI disponibles en anglais : Découvrez également notre parcours de 10 formations sur Power BI. Ce parcours vous donne le droit de vous inscrire à un coaching en ligne gratuit de 3 heures pour vous préparer à passer l'examen d'accréditation de Microsoft en Power BI.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Retour en haut