Pour plusieurs, la régression linéaire est un concept abstrait, étudié à l’école secondaire ou au CEGEP et vite oublié. Toutefois, en tant que gestionnaire d’entreprise, bien comprendre et maîtriser le concept de régression linéaire pourrait vous rapporter gros.
Qu’est-ce que la régression linéaire?
Quand deux variables sont reliées entre elles, on parle de corrélation. Dans ce cas, ce qui affecte une variable, effectera l’autre variable, puisqu’elles sont interdépendantes. Par exemple, le niveau de revenus et le taux d’impôt sont des variables corrélées. Plus le niveau de revenus augmente, plus le montant annuel d’impôt à payer augmente. Par contre, les deux variables n’augmentent pas nécessairement au même rythme. Toutefois, il nous est possible de déceler une tendance et là est le mot clé: “tendance”.
Corrélation positive et négative
On distingue deux types de corrélations, positives et négatives. Par exemple, le montant annuel d’impôt à payer est positivement corrélé au niveau de revenus, puisque plus les revenus augmentent, plus le taux d’impôt augmente. D’autres variables présentent une corrélation négative. Par exemple, en général, plus le prix d’un bien est élevé, moins le volume de vente est élevé.
L’intérêt est de déterminer le degré de corrélation entre des variables, afin de mieux prédire leur comportement dans l’avenir. En effet, en faisant varier une variable, on pourra prévoir l’impact sur l’autre variable.
Corrélation forte vs modérée
En plus du sens de la corrélation (positive ou négative), on peut observer un “degré” de corrélation. Ainsi, une corrélation peut être absente, faible, modérée ou bien encore forte.
Corrélations autres que linéaires
Certaines variables sont corrélées, sans que ce soit de façon linéaire. Une telle corrélation pourrait suivre une trajectoire courbe, par exemple. Les ventes d’un nouveau produit ont souvent ce type de comportement dans le temps, soit que les ventes sont très élevées au départ et s’atténuent par la suite (diminution de l’effet de nouveauté) ou encore soit que les ventes sont peu élevées au départ (tentatives de percer le marché) et qu’elles augmentent rapidement par la suite (phénomène de “hockey stick”).
Coefficient de corrélation
Le coefficient de corrélation prendra donc une valeur entre -1.0 (parfaite corrélation négative) et 1.0 (parfaite corrélation positive), un coefficient de corrélation de 0.0, signifiant qu’il n’y a aucune corrélation entre les variables. Dans Excel, il existe une fonction pour calculer le coefficient de corrélation. Il s’agit de la fonction Pearson(), que vous pourrez voir dans l’exemple plus bas.
Erreur fréquente à ne pas commettre
Une des erreurs fréquentes est de confondre la corrélation entre deux variables avec la cause de cette relation. En effet, pour reprendre un exemple courant, s’il existe une corrélation entre le nombre d’armes à feu dans une région et son taux de criminalité, peut-on conclure que le taux de criminalité est plus élevé car le nombre d’armes à feu est plus élevé ou alors que le nombre d’armes à feu est plus élevé car les gens souhaitent davantage se protéger dans les régions où la criminalité est plus importante ? Il ne faut pas oublier non plus que d’autres paramètres pourraient entrer en ligne de compte comme l’âge des personnes, leur niveau de revenu, leur niveau d’éducation, etc.
Exemple
Comme gestionnaire d’entreprise, je pourrais m’interroger sur la relation entre le nombre d’appels effectués par mon équipe de développement des affaires et le niveau de revenus générés. Pour ce faire, il suffirait de calculer le coefficient de corrélation entre le nombre d’appels effectués par jour et les ventes réalisées. Ci-bas, nous pouvons constater qu’il existe une relation positive entre ces deux variables. En effet, plus l’équipe de développement des affaires effectue d’appels téléphoniques, plus les ventes augmentent. Toutefois, cette corrélation, à 0.61, peut être qualifiée de modérée.
Effectuer une prévision, en contexte de régression linéaire simple
Pour savoir comment effectuer une prévision, via une régression linéaire simple, je vous invite à consulter l’article: Analyse prédictive dans Excel: Régression simple.
Formation complémentaire
Développez vos compétences en analyse de données et exploitez les fonctions d’Excel qui permettent de manipuler, gérer et transformer des données qui proviennent de diverses sources et différents formats, sans faire intervenir Power Query ou le VBA, en suivant la formation Excel – Traitement, manipulation et analyse de données.
Voici quelques commentaires d’apprenants ayant suivi cette formation :
La mission du CFO masqué est de développer les compétences techniques des analystes et des contrôleurs de gestion en informatique décisionnelle avec Excel et Power BI et favoriser l’atteinte de leur plein potentiel, en stimulant leur autonomie, leur curiosité, leur raisonnement logique, leur esprit critique et leur créativité.
Bonjour,
Rien à ajouter mais juste pour vous dire que votre blog est bien le seul réellement intéressant (francophone) que j’ai pu trouver jusqu’à maintenant concernant d’Excel. Et c’est un utilisateur LibreOffice qui parle 🙂
Merci pour le partage de vos connaissances.