Connaissez-vous les graphiques en rayon de soleil (sunburst) ?
Dans notre galerie de visualisations, nous vous présentons ce graphique dans son utilisation « standard », soit la présentation de données sous forme hiérarchique. Dans cet exemple, nous utilisons le graphique pour présenter les ventes de différents produits et nous présentons le tout selon la pièce et la catégorie de produits auxquelles chaque produit appartient.
Pour y arriver, les données doivent être structurées d’une façon très précise. Les niveaux de présentation (ici : Pièce, catégorie de produits, sous-catégorie de produits) doivent être présentées en colonne. Chaque colonne représente un nouvel anneau à notre graphique. La dernière colonne doit représenter les valeurs à attribuer à chaque rayon de soleil. Dans notre exemple, les données ressemblent à ceci :
Nouvelle utilisation « non standard » du graphique en rayons de soleil
Je suis récemment tombée sur un article de McKinsey & company qui utilise le graphique en rayons de soleil pour présenter un niveau de gravité pour 6 différents risques liés au tourisme pour certaines villes.
J’ai trouvé cette visualisation très intéressante et j’ai voulu la reproduire :
J’ai donc dû structurer mes données de façon à ce qu’elles soient bien représentées par le graphique en rayons de soleil. Rappelons-nous des critères :
- On doit avoir une colonne pour chaque niveau de la « hiérarchie » (détermine le nombre d’anneaux)
- On doit avoir une colonne pour les valeurs (détermine la taille des rayons)
Dans ce cas-ci, il n’y a pas réellement de hiérarchie, mais j’ai 5 quintiles à représenter par des anneaux distincts. J’ai donc créé 5 colonnes pour avoir 5 anneaux. La première colonne contient le nom du risque en question puisque c’est cette colonne qui servira à construire la légende du graphique. Les 4 autres colonnes doivent contenir une valeur (« X » dans ce cas-ci) lorsque cette partie de l’anneau doit être colorée, mais la valeur précise importe peu.
Finalement, j’ai créé une colonne qui contient la valeur 1 pour chaque risque puisque je veux que chaque risque ait une taille de rayon similaire.
Les données initiales étaient les suivantes :
Et le résultat final est le suivant :
Prenons le risque « menaces sur la culture et le patrimoine » comme exemple pour bien comprendre. Ce risque était situé au quintile #3. Nous souhaitons donc avoir 3 anneaux colorés dans notre rayon de soleil. On voit donc que les 3 premières colonnes contiennent des valeurs mais les niveaux 4 et 5 n’en contiennent pas.
Inversement, le risque « Dépendance de l’économie locale à l’égard du tourisme » est au quintile #1. On souhaite donc voir 5 anneaux colorés pour ce risque. C’est pourquoi les 5 premières colonnes des données contiennent des valeurs.
Vous pourriez utiliser le graphique en rayon de soleil de cette façon pour présenter par exemple :
- Les notes (en quartile) d’étudiants dans différentes matières (math, français, histoire, etc.)
- Votre positionnement de marché pour différents produits
- Les notes moyennes par question pour une sondage
- Et plus encore !
Bonus : Automatiser la préparation des données
Pour automatiser la création de ce graphique, vous souhaiterez probablement transformer des notes en quintile (notes de 1 à 5) pour obtenir la structure requise. Pour y arriver, j’ai créé une requête avec Power Query qui transforme les notes en quintiles et qui prépare la structure de données parfaite.
Mes données initiales étaient celles-ci :
Et je souhaite obtenir ceci pour la ville de Dubrovnik :
J’importe donc mes données sources dans Power Query.
Je sélectionne la colonne de Risques et je « Supprime le tableau croisé dynamique des autres colonnes ». Cette étape me permet de « dépivoter » les villes et ainsi les avoir dans une seule colonne plutôt qu’une colonne par ville.
J’ajoute ensuit des colonnes conditionnelles pour créer les colonnes « Niveau 2 » à « Niveau 5 ». Les conditions sont les suivantes :
- Niveau 2 : if [Quintile] <5 then “X” else null
- Niveau 3 : if [Quintile] <4 then “X” else null
- Niveau 4 : if [Quintile] <3 then “X” else null
- Niveau 5 : if [Quintile] =1 then “X” else null
J’ajoute ensuite une colonne personnalisée contenant la valeur « 1 » pour chaque ligne. C’est cette valeur qui donnera un rayon de la même taille pour tous les risques.
Finalement, je filtre les données sur la ville de Dubrovnik et le tour est joué ! Lorsque les données seront mises à jour, le graphique pourra être actualisé en un seul clic.
Fichier d’accompagnement VIP à télécharger
Pour télécharger le fichier utilisé dans ce tutoriel, devenez membre VIP du CFO masqué.
Formation complémentaire
Pour une introduction à la visualisation de données et au data storytelling, et obtenir des canevas qui peuvent être réutilisés afin de créer des visualisations de données percutantes et des tableaux de bord ou rapports qui visent en plein dans le mille, suivez la formation Créer des visualisations de données percutantes.