La science des données simplifiée avec Fabric Data Science

Publié le 12 mars 2024
par Kim Leblanc BAA
Le CFO Masqué - Fabric Data Science

Qu’est-ce que Fabric Data Science ?

Fabric Data Science est, comme son nom l’indique, le module de Microsoft Fabric dédié à la science de données.

Regardons de plus près la science de données et les avantages d’utiliser l’environnement Fabric pour l’exécuter.

 

Quelques exemples d’utilisation de la science des données

Commençons par vous donner une idée de ce qui peut être fait avec la science de données. Voici 2 exemples, parmi tant d’autres.

  • Analyser les comportements d’achats web de clients pour ensuite personnaliser les recommandations de produits ou bien optimiser les campagnes publicitaires.
  • Analyser et surveiller une chaîne de production et en prévoir les pannes d’équipement pour ainsi réduire les coûts en prévoyant la maintenance des équipements au bon moment.

Maintenant que nous avons une idée de ce que c’est, allons plus loin avec la description des étapes de la science de données en utilisant le diagramme suivant :

Fabric Data Science

Source: Data science in Microsoft Fabric – Microsoft Fabric | Microsoft Learn

 

Le dernier élément du diagramme, « Insight » , est le but ultime de la science de données. Nous voulons trouver de l’information pertinente à partir d’un ensemble de données.

 

Pour arriver à ces « Insights », il faudra suivre les étapes suivantes 

 

1. Formuler un problème ou une idée

Merveilleux, comme tout est intégré dans la même solution, le scientifique de données pourra demander aux analystes d’intelligence d’affaires (BI) et aux développeurs Power BI de l’aider à bien formuler la problématique ou la prémisse de l’analyse à effectuer. Ils pourront d’ailleurs avoir accès aux mêmes sources de données.

 

2. Se connecter aux données et les parcourir pour se les approprier

C’est ici que commence l’exploration. Il faut se diriger au bas de l’écran de Power BI Service pour accéder à Fabric Data Science.

Fabric Data Science

 

Il est alors possible de se connecter aux données sauvegardées dans OneLake ou dans un Lakehouse, nul besoin de faire des copies de données, tout est intégré.

À ce stade-ci, l’utilisation des Bloc-notes s’avère de mise. Le scientifique de données pourra utiliser les technologies Apache Spark et Python pour explorer les données. Pour les moins habitués avec les codes de programmations, il pourra utiliser le Data Wrangler qui générera pour lui le code Python.

Au passage on pourra en profiter pour faire un peu de transformation et de nettoyages des données.

Fabric Data Science

 

Vous avez plus de détails sur les Bloc-notes dans l’article suivant : MS Fabric : Gérez vos données avec Synapse Data Engineering

 

3. Créer un modèle d’apprentissage automatique (Machine Learning) et l’expérimenter

C’est dans la section Modèle ML de Fabric Data Science que le scientifique de données opère sa magie! Il pourra installer des librairies et algorithmes pour effectuer son analyse prédictive. Le scientifique de données sera également en mesure de détecter des anomalies et valider la qualité des données.

Fabric Data Science

 

Il sera également utile de tester le modèle sur de nouvelles données acquises depuis sa création.

 

4. Enrichir le modèle et le rendre opérationnel

Dans la section Expérience, il est possible de sauvegarder différents essais avec différentes versions de code et de métriques. Puis de comparer les résultats entre eux. Et peaufiner votre modèle pour en arriver ultimement au modèle idéal.

Fabric Data Science

 

5. Partager les résultats (Insights)

Finalement, il est possible de partager les résultats de l’analyse en intégrant ces nouvelles données dans OneLake et ainsi les rendre disponibles pour des rapports Power BI et inviter les collègues à regarder le tout et analyser les résultats de leur côté.

 

Vous avez envie d’explorer la solution ?

Utilisez un exemple fourni par Fabric !

Fabric Data Science

 

Vous aurez le choix entre différentes problématiques/idées proposées, avec des Bloc-notes soit en Python ou en R et puis vous avez également quelques tutoriels pour vous aider.

Fabric Data Science

 

Note : Pour utiliser les Bloc-notes il est probable que vous ayez besoin de configurer Power BI Service pour utiliser la langue anglaise. C’est à vérifier si vous obtenez le message d’erreur suivant :

Fabric Data Science

 

Vous pouvez également, consulter notre série d’articles sur Microsoft Fabric.

Afin de recevoir nos nouveaux articles directement dans votre boite courriel, abonnez-vous à nos infolettres.

  1. Introduction à Microsoft Fabric, outil intégré pour l’analyse de données
  2. 3 étapes pour accéder à une version d’essai de Microsoft Fabric
  3. Accéder à OneLake directement par l’explorateur de dossiers Windows
  4. Microsoft Fabric : Intégrez vos données avec Data Factory
  5. Microsoft Fabric : Gérez vos données avec Synapse Data Engineering
  6. Découvrez l’entrepôt virtuel de Fabric et sa simplicité d’utilisation

 


Voici nos formations Power BI disponibles en français : Voici nos formations Power BI disponibles en anglais : Découvrez également notre parcours de 10 formations sur Power BI. Ce parcours vous donne le droit de vous inscrire à un coaching en ligne gratuit de 3 heures pour vous préparer à passer l'examen d'accréditation de Microsoft en Power BI.

CFO-Masque_Formations-en-ligne_FBLa mission du CFO masqué est de développer les compétences techniques des analystes et des contrôleurs de gestion en informatique décisionnelle avec Excel et Power BI et favoriser l’atteinte de leur plein potentiel, en stimulant leur autonomie, leur curiosité, leur raisonnement logique, leur esprit critique et leur créativité.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Retour en haut