Qu’est-ce que Fabric Data Science ?
Fabric Data Science est, comme son nom l’indique, le module de Microsoft Fabric dédié à la science de données.
Regardons de plus près la science de données et les avantages d’utiliser l’environnement Fabric pour l’exécuter.
Quelques exemples d’utilisation de la science des données
Commençons par vous donner une idée de ce qui peut être fait avec la science de données. Voici 2 exemples, parmi tant d’autres.
- Analyser les comportements d’achats web de clients pour ensuite personnaliser les recommandations de produits ou bien optimiser les campagnes publicitaires.
- Analyser et surveiller une chaîne de production et en prévoir les pannes d’équipement pour ainsi réduire les coûts en prévoyant la maintenance des équipements au bon moment.
Maintenant que nous avons une idée de ce que c’est, allons plus loin avec la description des étapes de la science de données en utilisant le diagramme suivant :
Source: Data science in Microsoft Fabric – Microsoft Fabric | Microsoft Learn
Le dernier élément du diagramme, « Insight » , est le but ultime de la science de données. Nous voulons trouver de l’information pertinente à partir d’un ensemble de données.
Pour arriver à ces « Insights », il faudra suivre les étapes suivantes
1. Formuler un problème ou une idée
Merveilleux, comme tout est intégré dans la même solution, le scientifique de données pourra demander aux analystes d’intelligence d’affaires (BI) et aux développeurs Power BI de l’aider à bien formuler la problématique ou la prémisse de l’analyse à effectuer. Ils pourront d’ailleurs avoir accès aux mêmes sources de données.
2. Se connecter aux données et les parcourir pour se les approprier
C’est ici que commence l’exploration. Il faut se diriger au bas de l’écran de Power BI Service pour accéder à Fabric Data Science.
Il est alors possible de se connecter aux données sauvegardées dans OneLake ou dans un Lakehouse, nul besoin de faire des copies de données, tout est intégré.
À ce stade-ci, l’utilisation des Bloc-notes s’avère de mise. Le scientifique de données pourra utiliser les technologies Apache Spark et Python pour explorer les données. Pour les moins habitués avec les codes de programmations, il pourra utiliser le Data Wrangler qui générera pour lui le code Python.
Au passage on pourra en profiter pour faire un peu de transformation et de nettoyages des données.
Vous avez plus de détails sur les Bloc-notes dans l’article suivant : MS Fabric : Gérez vos données avec Synapse Data Engineering
3. Créer un modèle d’apprentissage automatique (Machine Learning) et l’expérimenter
C’est dans la section Modèle ML de Fabric Data Science que le scientifique de données opère sa magie! Il pourra installer des librairies et algorithmes pour effectuer son analyse prédictive. Le scientifique de données sera également en mesure de détecter des anomalies et valider la qualité des données.
Il sera également utile de tester le modèle sur de nouvelles données acquises depuis sa création.
4. Enrichir le modèle et le rendre opérationnel
Dans la section Expérience, il est possible de sauvegarder différents essais avec différentes versions de code et de métriques. Puis de comparer les résultats entre eux. Et peaufiner votre modèle pour en arriver ultimement au modèle idéal.
5. Partager les résultats (Insights)
Finalement, il est possible de partager les résultats de l’analyse en intégrant ces nouvelles données dans OneLake et ainsi les rendre disponibles pour des rapports Power BI et inviter les collègues à regarder le tout et analyser les résultats de leur côté.
Vous avez envie d’explorer la solution ?
Utilisez un exemple fourni par Fabric !
Vous aurez le choix entre différentes problématiques/idées proposées, avec des Bloc-notes soit en Python ou en R et puis vous avez également quelques tutoriels pour vous aider.
Note : Pour utiliser les Bloc-notes il est probable que vous ayez besoin de configurer Power BI Service pour utiliser la langue anglaise. C’est à vérifier si vous obtenez le message d’erreur suivant :
Vous pouvez également, consulter notre série d’articles sur Microsoft Fabric.
Afin de recevoir nos nouveaux articles directement dans votre boite courriel, abonnez-vous à nos infolettres.
- Introduction à Microsoft Fabric, outil intégré pour l’analyse de données
- 3 étapes pour accéder à une version d’essai de Microsoft Fabric
- Accéder à OneLake directement par l’explorateur de dossiers Windows
- Microsoft Fabric : Intégrez vos données avec Data Factory
- Microsoft Fabric : Gérez vos données avec Synapse Data Engineering
- Découvrez l’entrepôt virtuel de Fabric et sa simplicité d’utilisation